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Wstęp 


Jednym z podstawowych problemów statystyki matematycznej oraz stosowanej jest wyzna- 
czenie na podstawie obserwacji pewnej wielkości losowej jej nieznanego rozkładu prawdopo- 
dobieństwa. Jednym z możliwych podejść do tego problemu jest poszukiwanie specyficznych 
własności probabilistycznych charakteryzujących dany rozkład prawdopodobieństwa. W roz- 
ważaniach tego typu szczególnie ważne są własności, które prowadzą do jednoznacznego okre- 
ślenia rozkładu prawdopodobieństwa. Na przykład wiadomo, że jedynym rozkładem ciągłym 
określonym na półprostej [0,co) z własnością „braku pamięci” jest rozkład wykładniczy, a jedy- 
nym rozkładem skupionym na zbiorze liczb całkowitych nieujemnych z tą własnością — rozkład 
geometryczny. 

W niniejszej rozprawie rozważany będzie problem charakteryzacji rozkładów prawdopodo- 
bieństwa na podstawie znajomości tylko pojedynczej funkcji regresji w różnych modelach upo- 
rządkowanych zmiennych losowych. Badania nad problemem charakteryzacyjnym tego typu 
zostały zapoczątkowane w roku 1967 przez Fergusona [28]. Scharakteryzował on rozkłady wy- 
kładniczy, Pareto i potęgowy jako jedyne, dla których regresja kolejnych statystyk porządko- 
wych jest liniowa, tzn. 

E(Xp+1:n | Xren) = Xn +b, 


dla pewnych a,b € R, gdzie X1., A... < Xn:n Są statystykami porządkowymi z próby o rozmia- 


rze n. Od tamtego czasu podobne zagadnienia były tematem wielu prac i monografii. Analo- 
giczny problem charakteryzacyjny można wypowiedzieć dla innych modeli uporządkowanych 
zmiennych losowych, a obok zwykłych statystyk porządkowych są nimi m.in. sekwencyjne 
statystyki porządkowe, statystyki porządkowe progresywnie cenzurowane typu II, wartości re- 
kordowe, k-te wartości rekordowe, jak również wartości rekordowe Pfeifera. 

W trakcie badań nad tymi różnymi modelami uporządkowanych zmiennych losowych oka- 
zało się, że mają one wiele wspólnych własności. Spostrzeżenie to doprowadziło do wprowa- 
dzenia przez Kampsa w roku 1995 pojęcia uogólnionych statystyk porządkowych, które służy 
unifikacji podejścia do wielu zagadnień związanych z pozornie różnymi modelami uporządko- 
wanych zmiennych losowych (zob. [36], [37]). W niniejszej pracy rozważamy w szczególności 


problem charakteryzacji rozkładów ciągłych przez funkcję regresji określoną wzorem 
E (aK) | x =x) = EG), 


3 


gdzie hi € są danymi funkcjami, a x. ne Pod są uogólnionymi statystykami porządkowymi 


z pewnego rozkładu prawdopodobieństwa. Zaprezentowane zostanie nowatorskie podejście do 
problemu charakteryzacyjnego w oparciu o własność Markowa rozważanych modeli. 

W rozdziale |1| przypomnimy podstawowe definicje i potrzebne w niniejszej rozprawie 
własności różnych modeli uporządkowanych zmiennych losowych, m.in. statystyk porządko- 
wych, górnych wartości rekordowych, a także uogólnionych statystyk porządkowych. Omó- 
wimy dokładnie problem charakteryzacji rozkładów prawdopodobieństwa na podstawie znajo- 
mości tylko pojedynczej funkcji regresji tych modeli oraz przedstawimy zarys koncepcji no- 
wego podejścia do problemu charakteryzacyjnego opartej na własności Markowa rozważanych 
modeli. Korzystając z tej własności wykażemy kluczowy lemat, w którym pokazana zostanie 
specyficzna struktura rekurencyjna regresji. W szczególności, własność ta pozwala zastąpić re- 
gresję niekolejnych uogólnionych statystyk porządkowych przez odpowiednio zmodyfikowaną 
regresję kolejnych zmiennych w tym modelu. Na koniec tego rozdziału wyprowadzimy istotne 
własności regresji modeli uporządkowanych zmiennych losowych. 

W rozdziale [2| rozważane będą charakteryzacje rozkładów absolutnie ciągłych o ciągłych 
funkcjach gęstości przez pojedyncze regresje niekolejnych uogólnionych statystyk porząd- 
kowych. Przedstawimy nowe warunki jednoznaczności charakteryzacji rozkładu absolutnie 
ciągłego w terminach jednoznaczności rozwiązania odpowiedniego problemu różniczkowego 
(równania różniczkowego lub układu równań różniczkowych). Otrzymane wyniki posłużą do 
przedstawienia nowych charakteryzacji rozkładów absolutnie ciągłych oraz do wyprowadze- 
nia nowych dowodów znanych charakteryzacji. Podamy charakteryzację dla pewnego roz- 
kładu beta oraz wykażemy, że rozkład normalny, Gompertza oraz Weibulla z parametrem 
kształtu ô > 1 są jednoznacznie charakteryzowane przez regresje niekolejnych uogólnionych 
statystyk porządkowych o odstępie dwa. Wyniki tego rozdziału są poprawioną wersją wyników 
pracy [13]. 

W rozdziale |3| wyniki rozdziału [2] zostaną uogólnione na klasę wszystkich rozkładów cią- 
głych, niekoniecznie mających funkcję gęstości. Wykażemy, że jednoznaczność charakteryzacji 
rozkładów ciągłych zachodzi wtedy i tylko wtedy, gdy odpowiednie problemy całkowe (rów- 
nania całkowe lub układy równań całkowych) mają jednoznaczne rozwiązanie. Korzystając 
z otrzymanych wyników podamy nowe charakteryzacje rozkładów ciągłych. W szczególno- 
ści wykażemy, że rozkład gamma, Gumbela i logistyczny są jednoznacznie charakteryzowane 
przez odpowiadające im regresje uogólnionych statystyk porządkowych o odstępie dwa. Wyniki 
tego rozdziału uogólniają wyniki pracy i są poprawioną wersją wyników opublikowanych 
w pracy [14]. 

Przedmiotem rozważań w rozdziale|4|jest analogiczny problem charakteryzacyjny dla dys- 
kretnych rozkładów prawdopodobieństwa z wykorzystaniem regresji słabych wartości rekor- 


dowych. Pokażemy, że jednoznaczność charakteryzacji w tym przypadku jest równoznaczna 


z jednoznacznością rozwiązania odpowiadającego równania różnicowego lub układu równań 
różnicowych z pewnymi niestandardowymi warunkami ograniczającymi. Jako przykład zasto- 
sowania podamy nowe charakteryzacje rozkładów dyskretnych oraz wykażemy, że rozkład Po- 
issona i ujemny dwumianowy są jednoznacznie charakteryzowane przez odpowiadające im re- 
gresje słabych wartości rekordowych o odstępie dwa. Pierwotne wyniki tego rozdziału zostały 
przedstawione w pracy [15]. 

Na zakończenie rozprawy, podsumowując uzyskane w niej wyniki, przedstawiamy rów- 
nież zestawienie problemów związanych z tematyką rozprawy, które nadal pozostają otwarte 


i z pewnością zasługują na podjęcie nad nimi dalszych badań. 


Rozdział 1 


Regresje modeli uporządkowanych 


zmiennych losowych 


Niech 4X,, n > 1} będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkła- 
dzie danym przez dystrybuante F. Przy ustalonym n zmienne losowe X1,...,X, mogą zostać do- 
wolnie uporządkowane, co prowadzi do otrzymania zależnych (uporządkowanych) zmiennych 
losowych. Najprostsze sposoby uporządkowania zmiennych losowych dają w wyniku statystyki 
porządkowe oraz wartości rekordowe. Podkreślmy, że mimo tego, że modele te mogą być zde- 
finiowane bez żadnych założeń co do rozkładów oraz zależności poszczególnych obserwacji, 
w rozważaniach niniejszej rozprawy ograniczamy się jedynie do przypadku, gdy X1,..., X, są 
niezależnymi zmiennymi losowymi o jednakowym rozkładzie. 

W rozdziale tym omówimy najpierw podstawowe modele uporządkowanych zmiennych lo- 
sowych, a następnie przypomnimy pojęcie uogólnionych statystyk porządkowych oraz ich wła- 
sności potrzebne w dalszym ciągu pracy. Przedstawimy problem charakteryzacji rozkładów 
prawdopodobieństwa przez regresje modeli uporządkowanych zmiennych losowych, który jest 
głównym tematem rozprawy. Przypomnimy własność Markowa zmiennych losowych, a na- 
stępnie pokażemy, że regresje modeli uporządkowanych zmiennych losowych mających tę wła- 
sność mają specyficzną strukturę rekurencyjną. Stanowi to punkt wyjścia do nowego spojrzenia 
na problem charakteryzacyjny, które prezentujemy w niniejszej rozprawie. Rozdział kończy 
się wyprowadzeniem własności regresji modeli uporządkowanych zmiennych losowych, które 


będą potrzebne w dalszym ciągu pracy. 


1.1 Modele uporządkowanych zmiennych losowych 


1.1.1 Statystyki porządkowe 


Statystyki porządkowe stały się przedmiotem badań już na początku dwudziestego wieku. 
Pojawiają się one w wielu obszarach statystyki i mają wiele praktycznych zastosowaniach. 
Liczne własności i zastosowania statystyk porządkowych zostały omówione m.in. w mono- 
grafiach [5] i [23]. Ich różne zastosowania np. w teorii niezawodności można znaleźć również 


w monografii Barlowa i Proschana [10]. 


Definicja 1.1. Niech (X;,...,X„) będzie próbą prostą, tzn. wektorem złożonym z niezależnych 
zmiennych losowych o jednakowym rozkładzie. Przypuśćmy, że wartości wektora zostały usta- 


wione w porządku niemalejącym 


Xin ŚL. < Xrin e... < Xun- 


Wówczas zmienną losową X,:n nazywamy r-tą statystyką porządkową z próby o rozmiarze n. 


Jeżeli X1,... , Xn są niezależnymi zmiennymi losowymi o absolutnie ciągłej dystrybuancie F 


z funkcją gęstości f, to łączna gęstość wektora (X1:n,. .., Xn:n) ma postać 
n 
PCE JUMO Meee ep, (1.1) 
i=1 


oraz 0 poza tym, a rozkład statystyki porządkowej X;., ma funkcję gęstości daną wzorem 


PX n(X) = 


op EO T -FOTA HER (1.2) 


Natomiast łączną gęstość r-tej i (r + k)-tej statystyki porządkowej (1 < r < r+k <n) można 


przedstawić następująco 


n! 
—1)!(k-1)!(n=r=k)! (13) 
-(F(x1)) f(a) (E 2) — Fn) (1-F(2))" " fla), 


dla xı < x2 oraz O poza tym. Korzystając ze wzorów (1.2) i (1.3) można wyprowadzić wzór na 


SOSA (xı ,x2) = (r 


warunkową funkcję gęstości X,.4., pod warunkiem X,:n = x] 


a (n—r)! 
fx ten Xn 2 |) = (k—1)'(n—r—k)! 


(= a (ZEN f(x2) 


1— F(x) 1—F(x1) 1- F(x) 


dla xı < x2 oraz O poza tym. 


1.1.2 Wartości rekordowe 


Pojęcie wartości rekordowych wprowadził Chandler w 1952 roku [17]. Od tamtego czasu 
badanie ich własności było tematem wielu prac i monografii. Wartości rekordowe są Ściśle 
związane z ekstremalnymi statystykami porządkowymi. Są stosowane w modelowaniu zdarzeń 
katastroficznych, jak również w teorii niezawodności do opisu tzw. modeli szoku. Ich liczne 
własności i zastosowania można znaleźć m.in. w monografiach [1], [4] i [46]. 

Niech {X,, > 1} będzie ciągiem niezależnych zmiennych losowych o jednakowym roz- 


kładzie danym przez dystrybuantę F. 


Definicja 1.2. Dla ustalonej liczby naturalnej r > 1 określamy najpierw ciąg czasów rekordo- 


wych następująco 
n=l Tam je hase r22. 
Wówczas r-ta wartością rekordową (inaczej rekordem) ciągu (X,, n > 1} jest zmienna losowa 
R,=Xq, r>l. 


Zauważmy, że dla rozkładów ciągłych, nawet o ograniczonym nośniku, powyższa definicja 
daje w wyniku nieskończony ciąg różnych wartości rekordowych. Jeżeli natomiast rozkład ob- 
serwacji ma atom w prawym końcu nośnika (tzn. istnieje x9 < » takie, że F(x9) — F(x9) > 0 
i F(x9) = 1), to z danego ciągu obserwacji można z dodatnim prawdopodobieństwem uzyskać 
skończoną liczbę różnych rekordów. W szczególności rekordy nie są poprawnie zdefiniowane 
dla rozkładów dyskretnych o skończonych nośnikach. Aby ominąć tę trudność Vervaat 


wprowadził pojęcie słabych wartości rekordowych. 


Definicja 1.3. Dla ustalonej liczby naturalnej r > 1 zdefiniujmy ciąg słabych czasów rekordo- 


wych następująco 
Weal, Th=mi]j>0,1623X%-15 FZZ 


Wówczas r-tą słabą wartością rekordową (inaczej słabym rekordem) ciągu (X,, n > 1} jest 
zmienna losowa 
W, = AT r > 1. 


Zatem obserwacja jest rekordem, jeżeli jest większa od wszystkim poprzednich wartości, 
a słabym rekordem, gdy jest większa lub równa niż poprzedni słaby rekord. W obu przypad- 
kach pierwsza obserwacja jest pierwszym rekordem (Ry = W; = X1), jest to tak zwany rekord 
trywialny. W przypadku zmiennych losowych o rozkładzie ciągłym definicje rekordów i sła- 


bych rekordów są równoważne z prawdopodobieństwem 1, natomiast dla zmiennych losowych 


o rozkładzie dyskretnym tak nie jest. Wtedy bowiem kolejne słabe rekordy z dodatnim praw- 
dopodobieństwem mogą być sobie równe, podczas gdy zwykłe rekordy tworzą prawie pewnie 
ciąg ściśle rosnący. 

W niniejszej pracy rekordy i słabe rekordy dla ciągu £X,, n > 1) niezależnych zmiennych 
losowych o jednakowym rozkładzie dyskretnym będą rozpatrywane jako odrębna klasa modeli. 
Z tego powodu poniżej prezentujemy własności rozkładów dyskretnych wartości rekordowych. 
Załóżmy, że nośnik rozkładu zmiennej losowej X; jest postaci S = {0,1,...,N}, gdzie N < œ. 
Niech py = P(X, =k) oraz qx = P(X, > k) = Vian Pi dla k € S. 

Jak już wyjaśniono powyżej, w przypadku zwykłych rekordów może być brany pod uwagę 


tylko nieskończony nośnik S = {0,1,...}. Wówczas funkcja rozkładu prawdopodobieństwa 


wektora (R;,...,R„) dana jest wzorem 
n—l Pj 
PR = jien R= hy) =P, (OS ee jha 
k=1 Vit 


Następnie zauważmy, że skoro R2 > Ry > 0, to R2 > 1. Podobnie R, > n— 1. Zatem warun- 


kowy rozkład prawdopodobieństwa R,._1 pod warunkiem R, = j jest dany wzorem 


P(R =k|R =j) =, r-1<j<k<». (1.4) 


dj+1 


Dla słabych rekordów mamy N < œ, a funkcja rozkładu prawdopodobieństwa wektora 


(W1, ..., Wn) jest postaci 


, Pi, , 
PW = jipe W= =p AA O<J<...<jn<N. 


Natomiast warunkowy rozkład prawdopodobieństwa W,.; pod warunkiem W, = j jest postaci 


PW =k|W,= j) =, O<j<k<N. (1.5) 

dj 
Zauważmy na koniec tego paragrafu, że warunkowe rozkłady oraz nie zależą od r. 
Powyższą własność zachowują również warunkowe rozkłady niekolejnych rekordów i słabych 


rekordów. 


1.1.3 Uogólnione statystyki porządkowe 


Statystyki porządkowe, jak i wartości rekordowe oparte na rozkładach ciągłych można wy- 
razić w terminach tego samego ogólnego modelu, mianowicie modelu uogólnionych statystyk 


porządkowych. Model ten został zdefiniowany przez Kampsa w następujący sposób. 


Definicja 1.4. Niech n € N, k > 0, m,,...,m,_1 € R, będą parametrami takimi, że 


n—1 
y=k+n=j+) m>0, 1<j<n-1. 
i=j 


(1) (n) 


Mówimy, ze zmienne losowe U; ',...,U4 * sąuogólnionymi statystykami porządkowymi z roz- 
kładu jednostajnego z parametrami m4 ,... ,mmn_1 oraz k, jeżeli ich łączna funkcja gęstości praw- 


dopodobieństwa jest postaci 


dla O <uj <... < un < 1 oraz O poza tym. 
Jeżeli teraz F oznacza dowolną dystrybuantę, to mówimy, że zmienne losowe x. Ks xl”) 


są uogólnionymi statystykami porządkowymi z rozkładu F, jeżeli 


gdzie FT! oznacza funkcję kwantylową rozkładu F określoną jednoznacznie równościami 


F'Qy)=inffxeR:F(x)>yj), ye(0,1], F"'(0)=F"'!(0*). 


Stosujemy tu standardową notację f(a") na oznaczenie granicy prawostronnej funkcji f 


w punkcie a. 


Zauważmy, że jeżeli F jest dystrybuantą absolutnie ciągłą, której odpowiada funkcja gęsto- 
Sci f, to łączna funkcja gęstości prawdopodobieństwa zmiennych losowych xl), nei „x jest 


następująca 


i=1 


1 M nl n—1 = 
re ae ‘(tty een) =k (Ti „) (Tie TOKO) (1 — F (xn))“ mo. (1.6) 


dla F"'(0) < xı <... < xn < F7!(1) oraz 0 poza tym. 
Stosowana jest również inna definicja uogólnionych statystyk porządkowych z rozkładu 
jednostajnego wprowadzona przez Cramera i Kampsa [18]. Podali oni równoważną definicję 


przy użyciu iloczynów niezależnych zmiennych losowych o odpowiednich rozkładach beta. Za- 


uważmy najpierw, że parametry m1, ...,Mn—1 € R oraz k > 0 wyznaczają jednoznacznie wielko- 
Sci 4,..., Y—1- Z drugiej strony, jeśli znane są liczby Y4,...,Y„ > 0, to parametry mı, ...,Mn—1 


oraz k mogą być równoważnie określone jako 


m; =Y; Yz l, k=nh. 


Dlatego możemy mówić od razu, że parametrami modelu uogólnionych statystyk porządko- 


wych są dowolne liczby dodatnie %1,..., Yn > 0. 


Definicja 1.5. Niech n € N, y,...,y, > O oraz niech B;,...,B„ będą niezależnymi zmien- 


nymi losowymi takimi, ze Bj ma rozkład Beta(y;,1), 1 < j <n. Mówimy, że zmienne losowe 
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ZARA wóz uj” są uogólnionymi statystykami porządkowymi z rozkładu jednostajnego z para- 
metrami Yy,..., Yn, jeżeli 


ug” *1-T[B; l<r<n, 
i=l 


. d p 22 Z . 
gdzie = oznacza równość rozkładów zmiennych losowych. 


Pojęcie uogólnionych statystyk porządkowych pozwala na ujednolicenie podejścia do wielu 
zagadnień probabilistycznych i statystycznych związanych z pozornie różnymi modelami upo- 
rządkowanych zmiennych losowych. Przykładowo zamiast dowodzić pewne własności rozkła- 
dów najpierw dla statystyk porządkowych, a następnie dla wartości rekordowych i innych mo- 
deli, można spróbować udowodnić je od razu dla uogólnionych statystyk porządkowych. 

Powyższy model zawiera jako szczególne przypadki, wiele znanych modeli uporządkowa- 
nych zmiennych losowych. Zacznijmy od przypadku, gdy dystrybuanta F jest ciągła. Wówczas 
model uogólnionych statystyk porządkowych obejmuje następujące szczególne przypadki: 


Statystyki porządkowe X. £... < Xn:n Z próby losowej (X1,...,X,) o rozkładzie F są uogól- 
nionymi statystykami porządkowymi z parametrami mı = ... = m,_1 = 0 oraz k = 1 
(por. wzory (1.1) i (1.6)). Wtedy y; =n- j+1,1< j<n. 


Wartości rekordowe R;,...,R, ciągu (X,,n> 1) niezależnych zmiennych losowych o jed- 


nakowym rozkładzie F są uogólnionymi statystykami porządkowymi z parametrami 


m =... = m1] = —l oraz k = 1. Wtedyy;=1,1< j<n. 


Statystyki porządkowe progresywnie cenzurowane typu II stanowią uogólnienie statystyk 
porządkowych. W sposób naturalny pojawiają się one w eksperymentach dotyczących 
długości czasu pracy (lub czasu życia), gdzie nie są obserwowane awarie wszystkich ele- 
mentów biorących udział w teście. Na początku eksperymentu mamy do dyspozycji N 
obiektów X,,...,Xy oraz ustalamy liczbę n < N awarii, które chcemy zaobserwować. 
Następnie z pewnych powodów (np. ekonomicznych lub etycznych) dla r = 1,...,n, po 
r-tej awarii w eksperymencie usuwamy z niego z góry ustaloną liczbę R, obiektów spo- 
śród tych, które jeszcze pracują. Liczby R;,... ,R„ są ustalane na początku doświadczenia 


w taki sposób, że zachodzi równość N = n + Rı +... + Rn. Czasy kolejnych awarii 
Xi:n.N acz Xn:n,N 


nazywamy statystykami porządkowymi progresywnie cenzurowanymi (typu IT). Model ten 
jest szczegółowo omówiony w monografiach [6| [7]. Balakrishnan i in. [8] zauważyli, że 
jeżeli X;,...,Xy są niezależnymi zmiennymi losowymi o jednakowym rozkładzie F’, to 
Xīi:n N,- «+ Xn:n,N tworzą uogólnione statystyki porządkowe z rozkładu F z parametrami 
mj = R;orazk=R„+1. Wtedy yy =n— j+1+R;+...+R„ 1 <j<n. 
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Sekwencyjne statystyki porządkowe zostały wprowadzone w teorii niezawodności jako roz- 
szerzenie zwykłych statystyk porządkowych. Opisują one czasy kolejnych awarii w se- 
kwencyjnych układach typu k-spośród-n. Załóżmy, że danych jest n dystrybuant F),..., Fn 
oraz, że na początku eksperymentu obserwujemy czasy uszkodzeń n elementów, których 
czasy pracy są niezależnymi zmiennymi losowymi o jednakowym rozkładzie opisanym 
dystrybuantą Fi. Po pierwszej awarii w chwili X{„ = x; pozostałe n — 1 elementów zo- 
staje zastąpione przez nowe, których czasy życia są również niezależne i o jednakowym 
rozkładzie, ale opisanym rozkładem F> uciętym z lewej strony w punkcie xı. Proce- 
dura ta jest kontynuowana, a więc po i-tym uszkodzeniu w chwili X, = xi, pozostałe 
n—i elementów jest zastąpionych nowymi, których rozkład czasu życia jest opisany 
przez dystrybuantę F;+ı uciętą z lewej strony w punkcie x;. Otrzymane w ten sposób 


czasy awarii Xý X> 


l:n? tt tonin 


nazywamy sekwencyjnymi statystykami porządkowymi. Za- 
znaczmy, iż z sekwencyjnymi statystykami porządkowymi będziemy mieć do czynie- 
nia, również gdy działające elementy nie zostaną zastąpione przez nowe z innymi inten- 
sywnościami awarii, ale ich intensywności awarii ulegną zmianie ponieważ ich obcią- 
żenie będzie większe po awarii jednego z elementów systemu. Formalną definicję tego 
modelu można znaleźć w pracach 37]. Jeżeli F;(x) = 1 — [1—F(x)|* dla a; > 0, 
1 <i <n oraz pewnej ustalonej dystrybuanty F, to sekwencyjne statystyki porządkowe 
Xim- -Xan 84 uogólnionymi statystykami porządkowymi z rozkładu F z parametrami 


mj = (n= j+1)a; — (n— j)&j+ı— 1 oraz k = 0,. Ponadto yj = (n— j+1)Q;, 1 < j<n. 


k-te wartości rekordowe są uogólnieniem wartości rekordowych. Model ten został wprowa- 
dzony przez Dziubdzielę i Kopocińskiego w roku 1976 (por. [27]). Dla dowolnego natu- 
ralnego k > 1 definiujemy k-te czasy rekordowe dla ciągu 4X,, n > 1) następująco 


k . f. k 
Ti =|, TE =min{ §> Te: Xejąk N z, 1 n>l. 


n 


Wtedy ciąg k-tych wartości rekordowych określamy jako 


TAE 


ZI: 
Th 7 8 l 


+k—-1? a 


Dla k = 1 dostajemy zwykłe rekordy opisane w paragrafie Jeżeli {X,, n > 1} sanie- 


zależnymi zmiennymi losowymi o jednakowym rozkładzie F, to k-te wartości rekordowe 


RÓ), żyć „RY ciągu (X,,n > 1} są uogólnionymi statystykami porządkowymi z parame- 
trami mı =... = Mn—1 = —1 oraz k € N. Ponadto yj =k, 1 <j <n. 


Wartości rekordowe Pfeifera występują w sytuacji, gdy obserwujemy wartości rekordowe 
z ciągu obserwacji o niejednakowych rozkładach. Zakładamy, że dany jest ciąg dystrybu- 
ant {Fn n > 1}. W pierwszym kroku zakładamy, że wszystkie obserwacje mają ten sam 


(1) 


rozkład F; i czekamy na pojawienie się pierwszego rekordu, który oznaczamy przez X > A 
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Następnie zmieniamy rozkład obserwacji na Fy i czekamy na kolejny rekord X > prze- 


kraczający pierwszy rekord. Ogólnie, po zaobserwowaniu n-tego w kolejności rekordu 
X > „n> 1, zmieniamy wspólny rozkład następnych obserwacji na F,+1 (por. [47]). Je- 
żeli F;(x) = 1 — [1 — F(x)]B, gdzie F jest pewną ciągłą dystrybuantą oraz B; > 0, i > 1, to 
wartości rekordowe Pfeifera X > wodze NG są uogólnionymi statystykami porządkowymi 


z parametrami m; = B; — Bj41 — 1 oraz k = By. Ponadto y; = Bj, 1 <j <n. 


k,-wartosci rekordowe są kombinacją k-tych wartości rekordowych i wartości rekordowych 
Pfeifera. Dla danego ciągu liczb naturalnych {k,,n > 1}, interesuje nas kų najwięk- 
sza wartość (z rozkładu Fi), następnie ką największa wartość (z rozkładu F>), która 
jest większa od poprzedniej itd. (por. [36]). Wartości te oznaczamy X nE > wa 
W przypadku, gdy kn = 1, n > 1, otrzymujemy wartości rekordowe Pfeifera. Jeżeli 
F(x) =1-[1-F (x)]Bi, gdzie F jest pewną ciągłą dystrybuantą oraz B; > 0, i > 1, to 
k,-rekordy X a koo RA są uogólnionymi statystykami porządkowymi z parametrami 
mj = Bykj — Bjtikj41 — 1 oraz k = Buky. Wtedy y; = Bjkj, 1< j <n. 


Uwaga 1.1. W przypadku rozkładów dyskretnych znanych jest znacznie mniej szczególnych 
przypadków uogólnionych statystyk porządkowych. Tran w pracy wskazała tylko jeden 
model jako podmodel uogólnionych statystyk porządkowych z rozkładu dyskretnego, miano- 
wicie dyskretne statystyki porządkowe. Jak dotąd wiadomo również, że progresywnie cenzuro- 
wane statystyki porządkowe typu II należą do tej klasy (patrz [9], Rozdział 3). Zaznaczmy, ze 
w ogólnym przypadku nie należą do tej klasy ani dyskretne wartości rekordowe, ani słabe war- 
tości rekordowe, które jako odrębna klasa modeli będą przedmiotem naszych rozważań w roz- 
dziale 4] 

Na zakończenie tego paragrafu przypomnimy znane własności rozkładów uogólnionych sta- 
tystyk porządkowych. Cramer i Kamps pokazali, że funkcja gęstości r-tej uogólnionej sta- 
tystyki porządkowej z rozkładu jednostajnego ul”, l<r<n, (tj. gdy F(x) = x dla x € (0,1)) 


może być zapisana w postaci 


10 = Cr1Ghe (1 —x 


nity a) EO 


gdzie c,—1 = IE- Yj oraz 


sie 1 s? 
ce( | Yi; > YW ) = | d 1.7 


oznacza szczególną G-funkcje Meijera, a L jest odpowiednio dobranym konturem całkowania. 


Wiele własności G-funkcji można znaleźć w monografii (patrz Rozdział 3). Dla uproszcze- 
nia, w dalszej części pracy będziemy pisać G,(x | ,...,Y) zamiast Gry (i -=x | se. a) 
Uwaga 1.2. Równość (1.7) implikuje, że wartości funkcji f, , nie zależą od porządku parame- 


trów y1,..., Y (zob. [LI], Uwaga 2). 
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Uwaga 1.3. W dalszym ciągu pracy będziemy stosować następującą konwencję i notację. 


Niech F oznacza dystrybuantę, F = 1 — F oznacza jej funkcję przeżycia oraz Pr oznacza miarę 


probabilistyczną na R wyznaczoną przez F. Zwykle, przez nośnik miary Pp w literaturze okre- 


śla się najmniejszy zbiór borelowski A C R taki, że Pr(A) = 1. Jednakże w niniejszej pracy 


w przypadku dystrybuant ciągłych na R dla uproszczenia nośnikiem F będziemy nazywać prze- 
dział (a, B), gdzie 


a=a(F)=inffxeR:F(x)>0|, B=B(F)=sup{xe R: F(x) < 1). 


Inaczej będziemy również pisać, ze F jest rozkładem na przedziale («%,B). W szczególności 
dopuszczamy więc możliwość, że F jest funkcją stałą na pewnym właściwym podprzedziale 
przedziału (a«,B). 


Jeżeli dystrybuanta F jest ciągła, to dla £ > 1 gęstość x” pod warunkiem x) = x wzgle- 


dem miary Pp może być przedstawiona w postaci 


A 


(1.8) 


xex O 0 Cre- 1 
f | (t = PNA | Vrtdy+++5 Vere) FEB): x,t € 


gdzie funkcja 74 jest indykatorem zbioru A oraz dla x € |œ, B) 


BEE. gdyt>x, 


0, gdy t <x, 
oznacza uciętą lewostronnie dystrybuantę F (por. [1 9]). 


Zauważmy, ze zgodnie z Uwaga|I.2] warunkowa funkcja gęstości nie zależy od kolej- 


ności parametrów Y,._1,..., Y,/. Bez zmniejszania ogólności rozważań możemy założyć np. że 


Yı L... < Y oraz Prey Ś... < Ype. Trzeba natomiast zwracać uwagę na to, czy Y, 1 < Y, lub 
%r+1 = Yr itp. 

Zaznaczmy również, że rozkłady brzegowe oraz warunkowe uogólnionych statystyk porząd- 
kowych wyrażają się przez skomplikowane funkcje specjalne, co znacznie utrudnia badanie ich 


własności. Ominięcie tego problemu jest jednym z celów niniejszej rozprawy. 


1.2 Problem charakteryzacji rozkładów prawdopodobień- 
stwa przez regresje modeli uporządkowanych zmiennych 


losowych 


Jednym z podstawowych problemów statystyki jest wyznaczenie nieznanego rozkładu 
prawdopodobieństwa na podstawie obserwacji danych statystycznych. W klasycznym podejściu 


obserwowane są wartości próby losowej (X1,...,X,) rozmiaru n ciągu niezależnych zmiennych 
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losowych o jednakowym rozkładzie określonym przez dystrybuantę F. Następnie próba stanowi 
podstawę wnioskowania statystycznego, estymacji parametrów, czy też testowania hipotez sta- 
tystycznych. Mniej standardowym podejściem jest analiza różnych własności rozkładu, które 
determinują albo pewne rodziny rozkładów, albo w niektórych przypadkach określają dokładną 
postać szukanej dystrybuanty F. Liczne przykłady charakteryzacji różnych rozkładów prawdo- 
podobieństwa można znaleźć np. w monografii [32]. 

Wiele prac zostało poświęconych problemowi charakteryzacji rozkładów prawdopodobień- 
stwa przy użyciu własności statystyk porządkowych X,., <... < Xn:n Z próby o rozmiarze n. 
Jednym z takich problemów jest charakteryzacja przez równanie regresji statystyk porządko- 


wych. Równanie regresji, wokół którego będziemy się koncentrować ma postać 
E(h(Xsn) | Xrn = x) =5(2), (1.9) 


dla ustalonych 1 < r < s < n, gdzie h oraz € są znanymi funkcjami określonymi na nośniku ba- 
zowego rozkładu F. Problem charakteryzacyjny tego typu można wyrazić za pomocą pytania: 
czy znajomość funkcji $ wystarcza do jednoznacznego wyznaczenia samego rozkładu F? Jako 
pierwszy tym problemem zajął się Ferguson, który w 1967 roku w pracy [28], dla s=r+ 1 
oraz h(x) = x scharakteryzował rozkłady wykładniczy, potęgowy i Pareto jako jedyne rozkłady 
absolutnie ciągłe określone przez liniową regresję 6 (x) = ax + b. Od tamtego czasu problem 
ten był tematem wielu prac i monografii. Na szczególną uwagę zasługuje zwłaszcza praca 
Dembińskiej i Wesołowskiego [25], w której autorzy uogólnili wynik Fergusona dla regresji 
niekolejnych statystyk porządkowych, a więc gdy s > r+-1. Franco i Ruiz podobnie 
jak Ferguson rozważali regresję kolejnych statystyk porządkowych, s = r + 1, ale dla ogólnego 
przypadku h i é, nawet obejmującego nieciągły rozkład F. Obszerny przegląd wyników dla 
tego zagadnienia można znaleźć na przykład w monografii [7]. Okazuje się, że wiele wyni- 
ków dla statystyk porządkowych ma swoje odpowiedniki dla wartości rekordowych R;,...,Rn 
ciągu {X,, > 1} niezależnych zmiennych losowych o jednakowym rozkładzie. W literaturze 
zajmuje swoje miejsce analogiczny do problem charakteryzacji rozkładów prawdopodo- 


bieństwa przez regresję wartości rekordowych 
E(h(R;) | R; = x) = (x). (1.10) 


Problem charakteryzacyjny tej postaci jako pierwszy rozważał Nagaraja. W pracy scha- 
rakteryzował on przez liniową regresję kolejnych wartości rekordowych te same rozkłady co 
Ferguson. Wynik ten został uogólniony w pracy na przypadek niekolejnych wartości re- 
kordowych. Rozważania dotyczące dowolnej funkcji regresji kolejnych wartości rekordowych 
zostały przedstawione w pracy [30]. Jednakże dla przypadku niekolejnych wartości rekordo- 
wych podobnie jak dla niekolejnych statystyk porządkowych problem charakteryzacji przez 
równania (1.9), jaki jest nadal otwarty. 
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Jak już wiemy statystyki porządkowe i wartości rekordowe oparte na rozkładach ciągłych 
są szczególnymi przypadkami tego samego modelu uogólnionych statystyk porządkowych. Za- 
tem problemy charakteryzacyjne opisane powyżej można zunifikować. Dla ustalonych 7,/ > 1, 
niech xi” so będą uogólnionymi statystykami porządkowymi opartymi na rozkładzie okre- 
ślonym przez ciągłą dystrybuantę F o nośniku na przedziale (@,B), gdzie —œ < œ < B < ©. 


Załóżmy, że h: (a, 8) — R jest funkcją ściśle rosnącą, ciągłą oraz taka, ze E ja(xt ) | < 00, 


Określmy funkcję regresji h (x677) względem x jako funkcję € : (a, B) > R daną wzorem 


E(x) =E (n(xi"*) eE: x€(a.B). (1.11) 


Oczywiście równość ta jest bezpośrednim uogólnieniem zależności (1.9) i (1.10). Co więcej, 
lewa strona równania (1.11) zależy od r oraz £, jak również od parametrów Y,1,..., Yr+/, ale 


aby uniknąć skomplikowanych oznaczeń opuszczamy te zależności w notacji. 


Uwaga 1.4. Zauważmy, że wszystkie wyniki otrzymane przy założeniu, że funkcja h jest Ściśle 
rosnąca mogą być prosto przeniesione na przypadek, gdy h jest funkcją ściśle malejącą. Wów- 
czas wystarczy pomnożyć (1.11) przez —1 i dalej rozważać ściśle rosnącą funkcję —h zamiast 


h oraz —& zamiast €. 


Cramer i in. udowodnili, że dla każdej ciągłej dystrybuanty F istnieje jednoznacznie 
określona, ściśle rosnąca i ciągła funkcja regresji (1.11). Może być ona obliczona jako war- 


tość oczekiwana względem regularnej wersji odpowiadającego rozkładu warunkowego x” 


pod warunkiem z” = x. W niniejszej pracy rozważamy problem odwrotny, to znaczy pro- 
blem jednoznacznej charakteryzacji rozkładu F przez znajomość pojedynczej funkcji regresji € 
określonej wzorem (1.11). 

Tak określony problem jest kompletnie rozwiązany w przypadku £ = 1, a więc dla regresji 
kolejnych uogólnionych statystyk porządkowych. Wówczas F można wyznaczyć znając § ih 


w następujący sposób (por. [[19]) 


SEAN CCR 
r=- h- |, gry): xe (a8) 


Bieniek w pracy udowodnił, że dystrybuanta F jest jednoznacznie określona również przez 


regresję dualną tj. h (xi?) względem X('*U. Jednakże, podejście przyjęte dla przypadku £ = 1 


nie może zostać rozszerzone na przypadek dowolnego £ > 1, nawet dla szczególnych modeli 
uogólnionych statystyk porządkowych jak statystyki porządkowe czy wartości rekordowe. 

Dla £ > 2, gdy h(x) = x oraz © jest funkcją liniową postaci 6 (x) = ax +b, to albo a € (0,1) 
i F jest jednoznacznie określonym rozkładem potęgowym, albo a= 1 iF jest rozkładem wy- 
kładniczym, albo a > 1 i F jest rozkładem Pareto, patrz [16][19]. Niestety metoda dowodu wpro- 
wadzona przez Dembińską i Wesołowskiego w pracach [26], wykorzystująca rozwiązanie 
tak zwanego scatkowanego równania funkcyjnego Cauchy ego, nie może zostać zastosowana 


w przypadku nieliniowej funkcji €. W przypadku dowolnej regresji 6 podejście to prowadzi 
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do równania funkcyjnego, którego rozwiązanie jest nieznane. Jednakże, Bieniek w pracy 
wykazał, że do jednoznacznej charakteryzacji rozkładu F wystarcza znajomość dwóch funkcji 


regresji 
E(x) =E (u?) | x” =x) , E(x) =E (HQ?) Pod =x) 
Wówczas dystrybuanta F jest jednoznacznie wyznaczona wzorem 


wol OY), 
F0=1-e(-pe zoo ECD 


Powstaje stąd pytanie czy można wyznaczyć 6”, gdy znane są funkcje € i h. Pytanie to sta- 


nowi punkt wyjścia do naszych dalszych badań nad problemem charakteryzacyjnym zawartych 
w niniejszej rozprawie. 

W kolejnych rozdziałach zaprezentujemy nowe podejście do problemu charakteryzacyjnego 
w oparciu o własność Markowa rozważanych modeli uporządkowanych zmiennych losowych. 
W przypadku rozkładów absolutnie ciągłych o ciągłej gęstości wykażemy, że jednoznaczność 
charakteryzacji bazowej funkcji rozkładu F przez regresję uogólnionych statystyk porządko- 
wych jest równoważna z jednoznacznością rozwiązania odpowiedniego układu / — 1 
równań różniczkowych spełniającego pewne warunki ograniczające (zob. rozdział 2). W szcze- 
gólności, dla £ = 2 regresja 6 determinuje F jednoznacznie wtedy i tylko wtedy, gdy równanie 


różniczkowe h(x) 
r WYN) g, 
= x 
mra a © 


ma dokładnie jedno rozwiązanie @ takie, że nierówność 


(1.12) 


h(x) < P(x) < E(x) 
zachodzi dla x € (a, B), całka 
a (t) — p(t) 
jest zbieżna dla każdego x € (a,B) oraz rozbieżna dla x  B”, a ponadto 
l * §'@) 
lim 6(x)exp (-f ~~ dt | = 0. 
e PL fy E 
Wowczas dystrybuanta F jest jednoznacznie wyznaczona wzorem 


ra=- (fa 0") 


W przypadku rozkładów ciągłych (dystrybuanta F jest tylko ciągła, a odpowiadająca jej 


funkcja gęstości f jest albo nieciągła albo nie istnieje), w naszym kryterium równania różnicz- 


kowe zostają zastąpione przez odpowiednie równania całkowe (zob. rozdział B). 
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W niniejszej pracy będziemy również rozważać analogiczny problem charakteryzacyjny dla 
rozkładów dyskretnych. Niestety okazuje się, że w przypadku takich rozkładów wyżej opisane 
podejście nie może być zastosowane w modelu uogólnionych statystyk porządkowych. Może 
natomiast być efektywnie użyte w modelu słabych wartości rekordowych. 


Dla ustalonych r, > 1 rozważmy słabe wartości rekordowe W,., W,+¢ z rozkładu o niezde- 


generowanej dystrybuancie F określonej na przeliczalnym nośniku S$ C R takim, że elementy 


zbioru S tworzą ciąg Ściśle rosnący Œo < 04 <... < Qy, gdzie N < œ. Wtedy rozwazamy 


E(x) =E(h(W,+,)|W,=x), x€S, (1.13) 


gdzie h: S — R jest funkcją ściśle rosnącą i taką, że E |h(W,-2) | < co, Powyższy problem był 
najczęściej rozpatrywany dla funkcji A(x) = x oraz liniowej funkcji regresji 6 (x) = ax +b. Wia- 
domo, że wówczas są jednoznacznie charakteryzowane trzy rodziny rozkładów prawdopodo- 
bieństwa tj. rozkład geometryczny (gdy a = 1), ujemny rozkład hipergeometryczny pierwszego 
rodzaju (gdy 0 < a < 1) oraz ujemny rozkład hipergeometryczny drugiego rodzaju (gdy a > 1). 
W przypadku liniowej regresji kolejnych słabych rekordów (£ = 1) częściowy wynik otrzymał 
Stepanov [54], a uzupełnili go Wesołowski i Ahsanullah [57], którzy udowodnili również, że 
te same trzy rozkłady otrzymamy, jeśli założymy liniowość regresji słabych rekordów o odstę- 
pie dwa (£ = 2). W ogólnym przypadku liniowym (£ > 1) López-Blazquez zaproponował 
podejście polegające na redukcji problemu do przypadku regresji kolejnych słabych rekordów, 
którego rozwiązanie jest znane. Jednakże, jak zauważyli Karczewski i Wesołowski [38], to po- 
dejście nie działa w przypadku, gdy £ > 5 oraz N = œ. Zatem problem charakteryzacji przez 
liniowość regresji słabych wartości rekordowych nie jest całkowicie rozwiązany. Nieliniowe re- 
gresje W,,; względem W, oraz W,, względem W, były natomiast rozpatrywane przez Alieva 
odpowiednio w pracach [2] oraz [3]. W obu pracach autor zakładał, że nośnik bazowego roz- 
kładu jest nieskończony, N = œ. 

Zaznaczmy w tym miejscu, że w przeciwieństwie do regresji słabych rekordów regresje 
zwykłych rekordów z rozkładów dyskretnych charakteryzują tylko ogony rozkładów prawdopo- 
dobienstwa. Problem charakteryzacyjny przez liniową regresje R,__1 względem R, badali Sriva- 
stava oraz Korwar [40], którzy otrzymali charakteryzacje ogona rozkładu geometrycznego 
oraz ogona ujemnego rozkładu hipergeometrycznego drugiego rodzaju. Powiązane rozważania 
można również znaleźć w monografii [4] (patrz Rozdział 4.6). Obszerny przegląd wyników cha- 
rakteryzacji rozkładów dyskretnych z wykorzystaniem rekordów oraz słabych rekordów można 
znaleźć w pracy [24]. 

W przypadku charakteryzacji dyskretnych rozkładów prawdopodobieństwa przez regresje 
słabych wartości rekordowych w naszym kryterium zamiast pojawiają się odpowiednie 


równania różnicowe (zob. rozdział 4). 
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1.3 Własność Markowa i rekurencyjna struktura regresji 


W dalszej części pracy kluczową rolę odgrywa własność Markowa rozważanych modeli 


uporządkowanych zmiennych losowych. 


Definicja 1.6. Mówimy, że ciąg zmiennych losowych £Y,, n > 1} o takim samym zbiorze war- 
tości W ma własność Markowa, jeżeli dla każdego r > 1 rozkład warunkowy Y,+; pod warun- 


kiem Yj,...,¥; jest funkcją wyłącznie zmiennej Y, 
PIG <y | Yi,- Yp) = P(Y <y | Y,), y= Y. 
Taki ciąg nazywamy łańcuchem Markowa. 


W szczególności, z powyższej definicji otrzymujemy następującą ważną własność. Jeśli 


ciąg {Y„, n > 1} spełnia własność Markowa, to dla ustalonych 1 < s < r oraz dowolnej funkcji 


mierzalnej h: 9% — R takiej, że E|h(Y,+1)| < ee zachodzi 


E(A(Y;41) | Ys, Y) =E(h(Y,41) |Y,). (1.14) 


Uwaga 1.5. Oczywiście powyższa równość zachodzi prawie pewnie. W dalszej części pracy 
będą również pojawić się równości warunkowych wartości oczekiwanych tego typu. O wszyst- 


kich będziemy milcząco zakładać, że zachodzą z prawdopodobieństwem 1. 


Kamps w pracy (patrz Lemat 3.2) pokazał, że uogólnione statystyki porządkowe z roz- 
kładu absolutnie ciągłego posiadają własność Markowa. Wynik ten został uogólniony przez 


Keseling (patrz Twierdzenie 3.1) na przypadek rozkładów ciągłych. 


Twierdzenie 1.1. Jeżeli F jest dystrybuantą rozkładu ciągłego określonego na nośniku (a, B), 


to dla dowolnego r > 2 warunkowy rozkład > pod warunkiem x, ais xl) Jest taki sam 


jak warunkowy rozkład xy W pod warunkiem xy) 


(+1) (r) s F(y) Vr+1 a 
P(x >y|X =x) = (7%) , yYx>q. 


Inaczej wygląda sytuacja w przypadku uogólnionych statystyk porządkowych z rozkładu 
dyskretnego. Takie modele w ogólności nie tworzą łańcuchów Markowa. Wiemy, że należą do 
tej klasy dwa szczególne modele: statystyki porządkowe i progresywnie cenzurowane statystyki 
porządkowe typu II. Brak własności Markowa statystyk porządkowych z dyskretnego rozkładu 
o nośniku zawierającym co najmniej trzy atomy pokazał Nagaraja w pracy [45]. Odpowiednie 
rozważania można znaleźć również w monografii (patrz Rozdział 3.4). Analogiczny wy- 
nik dla progresywnie cenzurowanych statystyk porządkowych typu II otrzymali Balakrishnan 
i Dembińska w pracy [9] (patrz Twierdzenie 3.1.1). W ogólności, Cramer i Tran w wyka- 
zali, że własność Markowa nie zachodzi dla uogólnionych statystyk porządkowych z rozkładu 


mającego atomy. 
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Z drugiej strony zarówno dyskretne wartości rekordowe, jak i dyskretne słabe wartości 
rekordowe tworzą łańcuchy Markowa o prawdopodobieństwach przejścia odpowiednio 
i (1.5). Oznacza to oczywiście, że rekordy z rozkładów dyskretnych nie są zawarte w modelu 
dyskretnych uogólnionych statystyk porządkowych. Jest to główna przyczyna, dla której w roz- 
ważaniach dotyczących rozkładów dyskretnych ograniczamy się do słabych wartości rekordo- 
wych. 

Udowodnimy teraz lemat będący najważniejszą obserwacją, na której bazuje nowe podej- 
Scie do problemu charakteryzacyjnego zaprezentowane w niniejszej pracy. W lemacie przedsta- 


wiona została rekurencyjna zależność między odpowiednimi funkcjami regresji. 


Lemat 1.1. Niech {Y,,n > 1) będzie ciągiem zmiennych losowych określonych na nośniku W 


i spełniającym własność Markowa. Ustalmy r > 1, £ > 2 oraz niech œp: W — R będzie daną 
funkcją mierzalną taką, że E| (7,2) | < œ. Ponadto dla i =0,1,...,£ — 1 zdefiniujmy funkcje 


Pr_1--- > P1, Po rekurencyjnie 
P(X) "E(Qu Mei) | Yi =x), xe”. (1.15) 


Wówczas 
E(@0(¥,+0) | Y, =x) =Qo(x), xEV. 


Dowód. Dowód jest indukcyjny ze względu na £ > 2. Dla £ = 2 ustalmy funkcję ”:Y > R 


taką, że E| (7,42) | < œ i zdefiniujmy 
r(x) = E(@2(¥-+42) |Y =x), me) =E (p1) | Yr=x), 
dla x € Y. Wówczas korzystając z dobrze znanej własności warunkowej wartości oczekiwanej 
4C%>EE(X |%)|4|=E(X|4), (1.16) 
przyjmując Y =o(Y,)i”h=o(Y,,Y,+1) otrzymujemy 
E(@2(¥-+2) | Y,) =E|E(G(72) | %.¥-41) | Y,]. (1.17) 
Następnie z własności Markowa, dostajemy 
E(2(¥p+2) | Yr Y1) = E(@2(Yr+2) | Pra) = P1 Y1). (1.18) 
Wstawiajac do prawej strony równości mamy 
E(92(¥,+2) | ¥-) =£(@1(%-41) | ¥-) = Po(V;); 
co kończy dowód lematu dla £ = 2. Dla £ > 2 analogicznie dowodzimy, ze 


E (Pa Wręcz) | Y) "E|E(Pra Green) | Yrs Yre) | Ye] 
= E[E(@e+1(¥r+e+1) | Yre) | Yr] 
= E(@(¥,-+0) | Y,), 
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gdzie pierwsza równość wynika z własności (1.16), druga z własności Markowa (1.14), a trzecia 
wprost w definicji funkcji @ (1.15). Powyższa równość, zgodnie z zasadą indukcji matematycz- 


nej kończy dowód lematu. 


Z Twierdzenia [[.I|i Lematu[f.I|otrzymujemy następujący wniosek. 


Wniosek 1.1. Niech x), ee „x będą uogólnionymi statystykami porządkowymi z rozkładu 
określonego przez ciągłą dystrybuantę F o nośniku na przedziale («,B). Ustalmy r > 1, 


€>2 takie, że r+/ < n oraz niech œp: (a@,B) — R będzie funkcją mierzalną taką, że 


E|oe oe) | < co, Ponadto dla i = 0, 1,...,£— I zdefiniujmy Q/_1,..., Qi, Po rekurencyjnie 

9;(x) =E (9:41 (Z) | xl) = x) , x€(a,B). (1.19) 
Wówczas 
r+l r 

E(o(xf'9) |X) =x) =p), xe (a,8). (1.20) 
Analogiczny wniosek można wypowiedzieć dla dyskretnych wartości rekordowych i sła- 

bych wartości rekordowych, które jak już zauważyliśmy powyżej tworzą łańcuchy Markowa. 
Podsumowując, struktura regresji uogólnionych statystyk porządkowych jest taka, że regre- 
sja funkcji niekolejnych uogólnionych statystyk porządkowych jest równa odpowiednio zmo- 


dyfikowanej regresji kolejnych zmiennych w tym modelu. 


1.4 Własności regresji modeli uporządkowanych zmiennych 


losowych 


1.4.1 Własności regresji uogólnionych statystyk porządkowych 


Zbadamy najpierw własności regresji kolejnych uogólnionych statystyk porządkowych 


z rozkładu ciągłego. Załóżmy, że zachodzi relacja 
42) = B (h(x) [x =x), xe (0,8). (1.21) 


Z własności G-funkcji Meijera mamy Gy(x | y) = (1 —x)7"!. Zatem z równości dla£=1 


otrzymujemy następującą postać funkcji regresji 


é (x)= = lad [norom'are (1.22) 
F(x) "+i Jy 
Korzystając z powyższej formuły wykażemy ważne własności funkcji regresji (1.21). 
Lemat 1.2. Dla ustalonego r > 1, niech xy) xe) będą uogólnionymi statystykami porząd- 


kowymi z ciągłego rozkładu o dystrybuancie F określonej na przedziale (a, B). Załóżmy, że 


h: (a,B) > R jest funkcją ściśle rosnącą, ciągłą i taką, że E|h(x(*") | < œ oraz niech funk- 


cja regresji 6, : (a, B) — R bedzie określona wzorem (1.21). Wówczas 6; ma następujące wła- 


SNOŚCI: 
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(i) 6, jest ciągła na (a,B); 


(ii) jeżeli F jest różniczkowalna w sposób ciągły na (a,B), to 6, jest różniczkowalna na tym 


przedziale; 
(iii) E(x) > h(x) dla wszystkich x € (a,B); 


(iv) & jest rosnąca, a ponadto jest ona stała na przedziale I C (a, B) wtedy i tylko wtedy, gdy 


F jest stała na tym przedziale; 


(v) jeżeli h(B) = lim,_„g- h(x) < ©, to 61(B) = h(B). 


Dowód. W dowodzie użyjemy argumentów podobnych do (por. Lemat 3.4 tam zawarty). 
Ustalmy r € N i przyjmijmy dla uproszczenia zapisu y = 7,41. Z równości (1.22) oraz z pod- 
stawowego twierdzenia rachunku całkowego otrzymujemy, że 6; jest funkcją ciągłą. Co więcej, 
jeżeli F jest różniczkowalna na (a,B), to 6, jest również różniczkowalna na tym przedziale. 


Zauważmy, że równanie (1.22) można zapisać równoważnie w postaci 


=- fno) a(5 7a) = - [ko 1) dG(t (1.23) 


gdzie G(t) = (78) - . Z twierdzenia o wartości Średniej dla całki Riemanna-Stieltjesa istnieje 
x,B 


gdyż G(B) = 0 oraz G(x) = 1. Stąd i z monotoniczności funkcji h otrzymujemy 


h(x) < 61(x) <A(B), x€(a,B). (1.24) 


Co więcej, jeżeli 6; (x) = h(x) dla pewnego x < B, to 


Powyższa całka jest równa zero wtedy i tylko wtedy, gdy funkcja podcałkowa jest równa zero, 
czyli h(t) = h(x) dla pewnego t € (x, B), ale to jest sprzeczne z założeniem ścisłej monotonicz- 
ności funkcji h. Zatem h(x) < 6; (x), co dowodzi punktu (iii). 

Aby wykazać punkt (iv) załóżmy, że x1,xą są dwoma dowolnymi, ale różnymi punktami 
z przedziału (©, B). Bez straty ogólności możemy założyć, że x; < x2. Wtedy z równości (1.23) 


dostajemy 


Ei (x1) F(x)” — 61(22) Fin)? = f no) h(t r f Mo t)dF(t =- | kl h(t) dF (t 
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Stosując ponownie twierdzenie o wartości Średniej dla całki Riemanna-Stieltjesa otrzymujemy 
Ei (x1 )F (x1)” — 61(22)F (22)? = —h(0) [F(22)7 — F (x1), 


dla pewnego 0 € (x1,x2). Stąd 

F (x1) [61 1) —61(22)] = [61 2) — A(0)] [F(x2)7— F (x1)"] 
Z punktu (iii) otrzymujemy, że 6, (x2) — h(8) > O dla każdego 0 < x2. Zatem albo € jest stała, 
a więc F jest stała na przedziale (x;,x>), albo F jest ściśle rosnąca i € jest Ściśle rosnąca, co 


kończy dowód punktu (iv). 


Dowód punktu (v) wynika z nierówności (1.24) i twierdzenia o trzech ciągach. 
Wychodząc od Lematu [1-2] i korzystając z rekurencyjnej struktury regresji uogólnionych 
statystyk porządkowych (patrz Wniosek wykażemy teraz analogiczne własności regre- 


sji (1.11) dla dowolnego £ > 1. 


Lemat 1.3. Dla ustalonych r, > 1, niech x xl będą uogólnionymi statystykami po- 


rządkowymi z ciągłego rozkładu o dystrybuancie F określonej na nośniku (a,B). Załóżmy, że 


h: (a,B) > Rjest funkcją ściśle rosnącą, ciągłą i taką, że E |h (xl ) | < œ oraz niech funkcja 


regresji é : (a, B)  Rbgdzie określona wzorem (1.11). Wówczas 6 ma następujące własności: 
(i) 6 jest ciągła na (a,B); 


(ii) jeżeli F jest różniczkowalna w sposób ciągły na (a,B), to 6 jest różniczkowalna na tym 


przedziale; 
(iii) E(x) > h(x) dla wszystkich x € (a,B); 


(iv) & jest rosnąca, a ponadto jest ona stała na przedziale I C (a, B) wtedy i tylko wtedy, gdy 


F jest stała na tym przedziale; 


(v) jeżeli h(B) < e, to $(B) = h(B). 


Dowód. Oznaczmy @ = h i rozważmy funkcje Q/_1,...,Qo zdefiniowane jak we Wniosku[1.1] 
Lemat|1.2Jimplikuje, że Q; jest funkcją ciągłą na (a, B), o ile @;+, jest funkcją ciągłą, Q; > Ọi+1 
na (a,B), @; jest funkcją ściśle rosnącą pod warunkiem, że Q,+; jest funkcją rosnącą, ponadto 
jeżeli 0;41(B) < ©, to g;(B) = @41(B). Z założenia gy, jest funkcją ściśle rosnącą i ciągłą, 
a zatem funkcje Q,, 0 <i < £, są Ściśle rosnące i ciągłe, o > h, a ponadto o(p) =h(B), gdy 
h(B) < ». Alez Wniosku [1.1|mamy Qy = 6, co kończy dowód. 


Lemat 1.4. Niech r,l > 1. Załóżmy, ze h: (a,B) > R oraz g: (a,B) + (g(a),g(B)) są funk- 


cjami ciągłymi i Ściśle rosnącymi. Wówczas równość 


E(x) =E (a(x) | x” >. xe (a,B), (1.25) 
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gdzie x”, x są uogólnionymi statystykami porządkowymi z rozkładu określonego przez 


dystrybuantę F zachodzi wtedy i tylko wtedy, gdy zachodzi 
= r+l r = 
E (hog! (E+) | YP =y) = 0870), ye (e(a),s(B). 


| AGRO 


gdzie y” oraz są uogólnionymi statystykami porządkowymi z tymi samymi parametrami 


z rozkładu Fog". 


Dowód. Niech xy ), 1 < j < r+ £, będą uogólnionymi statystykami porządkowymi z parame- 
trami Y,...,Y-+¢ Z rozkładu określonego przez dystrybuantę F. Połóżmy 

¥) = g(x), 1<j<r+Ł. 
Wówczas yf ) 1 < j < r+£, sa uogólnionymi statystykami porządkowymi z rozkładu o dys- 
trybuancie F og"! określonej na nośniku (g(a),g(B)). Co więcej, dla y € (g(a«),g(B)) mamy 


E (hog! (+9) | YP =y) =E (nog! (x+) | (x0) =>) 
=E (h Ce eg 0) 


=fog U), 


co kończy dowód twierdzenia. 
Kładąc g = h widzimy, że warunek (1.25), gdzie x” ix) są uogólnionymi statystykami 


porządkowymi opartymi na rozkładzie F, jest równoważny 
E (YEO | YO =y) =o), ye (kla) h(B)), 


gdzie yO) i | AO są uogólnionymi statystykami porządkowymi (z tymi samymi parametrami) 
opartymi na rozkładzie F oh". Tak więc, jeśli tylko jest to pomocne, możemy bez straty ogól- 


ności założyć, że h(x) = x. Fakt ten został wcześniej zaobserwowany w pracy [19]. 


1.4.2 Własności regresji dyskretnych wartości rekordowych 


Przedmiotem rozważań w tym paragrafie będą analogiczne własności funkcji regresji war- 
tości rekordowych dla rozkładów dyskretnych. Niech {X,,n > 1) będzie ciągiem niezależ- 
nych zmiennych losowych o jednakowym rozkładzie dyskretnym określonym przez niezde- 
generowaną dystrybuantę F o przeliczalnym nośniku S$. W dalszej części pracy, bez zmniej- 
szenia ogólności rozważań, będziemy zakładać, że nośnik jest zbiorem następującej postaci 
S= {0,1,..., N}, skończonym dla N < œ bądź nieskończonym dla N = œ (patrz [22], Sekcja 2). 
Ponadto dla N < © przyjmujemy S = S\ {N}, a dla N = œ przyjmujemy Š = S. Przypomnijmy, 
że p = P(X; = k) oraz qg = P(X; > k) = yak Pi dla k € S. 
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Rozpatrzmy najpierw funkcję regresji kolejnych słabych wartości rekordowych określoną 


równaniem (1.13). Dla £ = 1, korzystając z równości otrzymujemy 
E1) = E (h(W,41) | Wr = j) L pate) jes. (1.26) 
qj k=j 
Z, powyższej równości widzimy, że regresja słabych rekordów nie zależy od r. Zatem zachodzi 
m.in. równość E (h(W,41) | W,) =E(h(W) | W1). 
Korzystając teraz z formuły (1.26) pokażemy trzy istotne własności regresji 6; kolejnych 


słabych wartości rekordowych. Poniższy lemat jest odpowiednikiem Lematu|I.2] 


Lemat 1.5. Dla ustalonego r > 1, niech W,,W,+1 będą słabymi rekordami z rozkładu o dystry- 


buancie F o nośniku S = {0,1,...,N}, gdzie N < œ. Załóżmy, że h: S — R jest funkcją Ściśle 


rosnącą i taką, że E|h(W,+1)| < œ oraz niech funkcja regresji 1: S R będzie określona 


wzorem (1.26). Wówczas € ma następujące własności: 
(i) 61(j) > h(j) dla dowolnego j € S; 

(ii) & (j) < €;( +1) dla dowolnego j € Š; 

(iii) jeżeli h(N) < ©, to 6; (N) =h(N). 


Uwaga 1.6. Jeżeli N < oo, to oczywiście mamy A(N) < o. Jeżeli N = œ, to A(N) jest zdefinio- 


wana jako granica h(N) = lim h(j), która może być zarówno skończona, jak i nieskończona. 
j>% 


Dowód. (i) Ustalmy j € §. Ponieważ h jest funkcją ściśle rosnącą, to dla dowolnego k > j mamy 
h(k) > h(j). Z równania (1.26) otrzymujemy 


AD inj) +— y prh(k 


dj di k=j+1 
> Zinc) 93 Pr=h 
dj Mai! J+H 


(ii) Wychodząc od równości (1.26) możemy zapisać 
N 
61(J)4j = $ h(k)pk, jES. 
k=j 


Wyznaczając teraz różnice pierwszego rzędu powyższego równania otrzymujemy dla j € S rów- 
nanie różnicowe 

(i+ lain — Ś1(J)qj; = —h(J)Pj, 
a w konsekwencji 


[51(3) ACI Pj = [516+1) Eaj JES. (1.27) 
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Na mocy punktu (i), lewa strona równania (1.27) jest dodatnia, zatem 6, (J + 1) > €1(j) dla 
jes. 
(iii) Jeżeli h(N) < ©, to dla ustalonego argumentu j € S mamy 


h(j) <h(k)<h(N), J<K<N. 


Mnożąc powyższe wyrażenie przez p;y, a następnie sumując po wszystkich k (od k = j do N) 


i dzieląc przez qj; otrzymujemy 


h(j) < S&U) SAN), JES, 


co implikuje 6; (N) < œ oraz & (N) = A(N). 
Następny lemat podaje analogiczne własności regresji (1.13) dla dowolnego / > 1. Jego 


dowód z wykorzystaniem Lematu oraz rekurencyjnej struktury regresji słabych rekordów 
może być przeprowadzony podobnie jak dowód Lematu|I.3| 


Lemat 1.6. Dla ustalonych r,£ > 1, niech W,,W,., będą słabymi rekordami z rozkładu o dys- 


trybuancie F określonej na nośniku S = {0,1,...,N}, gdzie N < ». Załóżmy, że h: S — R jest 


funkcją ściśle rosnącą i taką, że E |A(W,-4.2) | < œ oraz niech funkcja regresji & : S R będzie 
określona wzorem (1.13). Wówczas 6 ma następujące własności: 


(i) E(j) > h(j) dla dowolnego j € Š; 
(ii) E(j) < E(j +1) dla dowolnego j € S; 
(iii) jeżeli h(N) < %, to E(N) =h(N). 


Na koniec tego paragrafu podamy analogiczne własności regresji dyskretnych wartości re- 


kordów, które można wykazać podobnie jak własności regresji słabych wartości rekordowych. 


Lemat 1.7. Dla ustalonych r, ( > 1, niech R,,R,+¢ będą rekordami z rozkładu o dystrybuancie F 


określonej na nośniku S = {0,1,...}. Załóżmy, że h: S — R jest funkcją ściśle rosnącą i taka, 


że E|h(R,+0)| < œ oraz niech funkcja regresji 6: {r—1,r,...} R będzie określona wzorem 


E(J) =E (A(R 40) |Rr=J), j2Zr-1. (1.28) 
Wówczas 6 ma następujące własności: 
(i) €(j) > h(j +2) dla dowolnego j > r— 1; 
(ii) 6(j) < €(j +1) dla dowolnego j > r— 1; 


(iii) jeżeli lim h(j) < ee, to lim €(j) = lim h(j). 
j>” j>% 


Jro 
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Rozdział 2 


Charakteryzacje rozkładów absolutnie 
ciągłych przez regresje uogólnionych 


statystyk porządkowych 


Przedmiotem rozważań w tym rozdziale będą charakteryzacje rozkładów absolutnie cią- 
głych o ciągłych gęstościach przez regresje uogólnionych statystyk porządkowych (1.11). Ko- 
rzystając z rekurencyjnej struktury regresji uogólnionych statystyk porządkowych (zob. pod- 
rozdział [1.3) w podrozdziale [2.1] wykazemy, że jednoznaczność charakteryzacji rozkładu abso- 
lutnie ciągłego zachodzi wtedy 1 tylko wtedy, gdy odpowiedni problem różniczkowy (równanie 
różniczkowe lub układ równań różniczkowych) ma jednoznaczne rozwiązanie. 

Mimo że kryterium jednoznaczności, które otrzymamy jest zaskakująco proste, okazuje 
się ono trudne w zastosowaniu nawet dla szczególnych przypadków funkcji h i 6. Trudności 
związane z zastosowaniem tego kryterium wynikają miedzy innymi z nałożonych ograniczeń 
(warunków brzegowych) na rozwiązanie otrzymanego nieliniowego równania różniczkowego. 
Warunki brzegowe nie mają klasycznej postaci typu y(x0) = yo, jak w problemie Cauchy ego, 
ale są wyrażone w szczególności w postaci nierówności h(x) < y(x) < $(x) dla x € (a, B). 
W podrozdziale [2.2] badamy problem charakteryzacyjny z wykorzystaniem nowego kryterium 
dla regresji z £ = 2. Wykażemy jednoznaczność charakteryzacji w szczególnym przypadku, 
gdy 6 (x) —h(x) >0,gdyx>B . W podrozdziale |2.3|zastosujemy otrzymane wyniki w celu 
wyznaczenia nowych charakteryzacji rozkładów absolutnie ciągłych o ciągłych gęstościach 
przez regresje uogólnionych statystyk porządkowych. Podamy charakteryzację dla pewnego 
rozkładu beta oraz wykażemy, że rozkład normalny, Gompertza oraz Weibulla z parametrem 
kształtu 6 > 1 są jednoznacznie charakteryzowane przez regresję niekolejnych uogólnionych 
statystyk porządkowych z ¢ = 2. Korzystając z naszego podejścia wykażemy również, że roz- 
kłady wykładniczy, potęgowy 1 Pareto są charakteryzowane przez warunek przy założe- 


niu liniowości regresji § (x) = ax +b. Będzie to nowy elementarny dowód wyniku otrzymanego 


2] 


w pracy [16]. 
W rozdziale tym zakładamy, że F jest absolutnie ciągłą dystrybuantą o nośniku (a«,B), 
a funkcja gęstości f = F’ jest ciągła na («,B). Ponadto niech F(x) = 1 — F(x) oznacza funkcję 


przeżycia rozkładu F oraz niech 
H(x) = —logF(x), A(x) == = H' (x) (2.1) 


oznaczają odpowiednio funkcję hazardową oraz intensywność awarii rozkładu F. Oczywiście 


znajomość funkcji H lub A wystarcza do jednoznacznego określenia funkcji rozkładu F. 


2.1 Kryteria jednoznaczności charakteryzacji rozkładów ab- 


solutnie ciągłych 


Rozważymy najpierw regresję kolejnych uogólnionych statystyk porządkowych, tj. regre- 
sję z odstępem £ = 1. Załóżmy zatem, że zachodzi relacja 


E(x) =E (a(x) [xP =), x€(a,B). (2.2) 


Dla absolutnie ciągłej dystrybuanty F, wychodząc ze wzoru (1.22), możemy zapisać 


B 
EPO) =a LOSOWO? (2.3) 


Ponieważ funkcje h, F i f są ciągłe, to prawa strona ostatniego równania jest różniczkowalna, 
a zatem funkcja © jest również różniczkowalna na («,B). Różniczkując wyrażenie (2.3) stro- 


nami, a następnie odpowiednio porządkując otrzymujemy 


E(x) = pra [5 (x) — AQ) HF (x). (2.4) 


Z Lematu [1.2iii) mamy 6 > h. Zatem z ostatniego równania wnioskujemy, że ciągłość funk- 
cji gęstości f pociąga za sobą ciągłość pochodnej 6' oraz funkcja Ś jest stała na przedziale 
I C («,B) wtedy i tylko wtedy, gdy F jest stała na 7 (por. Lemat 1.2). Stąd, w niniejszym roz- 
dziale, bez straty ogólności będziemy przyjmować, że wszystkie rozpatrywane funkcje & sa 
Ściśle rosnące, ciągłe i różniczkowalne w sposób ciągły na przedziale (œ, B). 

Dzieląc teraz obie strony równania przez Y,1|$(x) —A(x)], a następnie całkując wzglę- 


dem x wyznaczamy funkcję H 


. LP (t) 
H6)= > | aa x€ (a,B). (2.5) 


Stąd dla dowolnego rozkładu F, dla którego zachodzi równanie regresji (2.2) mamy 
* (t) 
= dt <», x€E(a,B) (2.6) 
I, E) — h(t) 
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oraz 


B It 
f ao dt = », (2.7) 
gdyż dla każdego rozkładu F, jego funkcja hazardowa H dąży do œ, gdy x + B”. Zauważmy 
ponadto, że 
lim §(x) exp (- i ant) = 0. (2.8) 
x>B- a §(t) —h(t) 


Istotnie, korzystając z otrzymujemy 
E(ayenp (— S gry ya) Gap) = EF", 


co na mocy musi dążyć do 0, gdy x > B~. 
Przejdźmy teraz do przypadku regresji (1.11) z odstępem £ = 2. W dowodzie głównego 


twierdzenia wykorzystamy następujący lemat. 


Lemat 2.1. Dla ustalonej liczby naturalnej r > 1, niech Y,...,y, > O będą dowolnymi para- 


metrami oraz 0 < Yr+1 < Yr+2. Przypuśćmy, że 


(a) h,Ę: (a,B) R są funkcjami Ściśle rosnącymi, ciągłymi i takimi, ze h(x) < &(x) dla 
x € (a«,B), a ponadto funkcja © jest różniczkowalna w sposób ciągły, 


(b) y = T(x) jest dowolnym rozwiązaniem równania różniczkowego 


y = (a), x € (a,B), (2.9) 

takim, że h(x) < t(x) < E(x), x€(a,B), (2.10) 

CZE xE (a,B), (2.11) 

[ ae mó (2.12) 

s neta (- Ya") =0. (2.13) 
Wtedy wzór 

tedy wz a -1-00(- f zza). elep. (2.14) 


gdzie n (t) = 5) + ou określa absolutnie ciągłą dystrybuante z ciągłą funkcją gęstości i taką, 


s Y+1 127 
że dla uogólnionych statystyk porządkowych y” ; z” z parametrami Yy,...  y+2 z rozkładu G 
zachodzi równość 


E(x) =E (ari) BAG =x), x€(a,B). (2.15) 
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Uwaga 2.1. Jeżeli $(B) = lim, ,g- 6(x) < o, to przy spełnionym warunku waru- 
nek jest automatycznie spełniony. 
Dowód Lematu 2.1] Niech t będzie dowolnym rozwiązaniem równania różniczkowego (2.9). 
które spełnia warunki (2.10)—(2.13). Pokażemy najpierw, że funkcja G określona wzorem 
jest dystrybuantą pewnego absolutnie ciągłego rozkładu o ciągłej funkcji gęstości. 

Na mocy równania (2.9) można łatwo sprawdzić, że funkcja G określona wzorem (2.14) 


może być zapisana w następujących równoważnych postaciach 


en (pO 
G(x) =1l-e p( T) =a ar) (2.16) 


bądź 


1 sf r(t 
G(x) = 1 — exp (- = f a6) “a ar) : (2.17) 
Wystarczy zatem pokazać, że wzór bądź określa dystrybuantę G o żądanych 
własnościach. Zauważmy najpierw, że skoro funkcje h, € są ściśle rosnące, to biorąc pod uwagę 
warunek z równania różniczkowego dla dodatnich parametrów 7,+1, 7,42 wynika, 
że rozwiązanie T tego równania jest również funkcją ściśle rosnącą na (a,B). Ponadto, po- 
nieważ funkcja h jest ciągła a $ różniczkowalna w sposób ciągły, to z równania (2.9) wynika 
również, że funkcja T jest różniczkowalna w sposób ciągły na («,B). Tak więc funkcja pod- 
całkowa w równaniu jest dodatnia i ciągła. Stąd funkcja G określona tym równaniem 
jest funkcją rosnącą, a na mocy podstawowego twierdzenia rachunku całkowego jest ona rów- 
nież różniczkowalna w sposób ciągły. Co więcej, gdy x > a*, to G(x) > 0, a gdy x  B”, to 
z warunku otrzymujemy, że G(x) 1. Tak więc funkcja G jest dystrybuantą o żądanych 
własnościach. 
Niech yo, yet) oraz y+?) oznaczają uogólnione statystki porządkowe z rozkładu G. 


Pokażemy najpierw, że dla x € (a, B) zachodzi równość 
(x) =E (AT?) | xe) =x). (2.18) 
Korzystając ze wzoru (2.17) otrzymujemy funkcję gęstości rozkładu G w postaci 


_66) r) 
8) = 7,2 TR) A) 


Mnożąc stronami przez G(x)%+2~!, po prostych przekształceniach sprowadzamy to równanie 


do postaci 
Yre2h(x)G(x) "2" g(x) = w21) G(x)! glx) — Glx)F21'(x). 


Całkując stronami powyższą równość po dowolnie ustalonym przedziale [x,y] C (a@,B), gdzie 
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a<x<y< B, dostajemy 
Yr+2 [ro h(t)G(t)%+27'g(t)dt 


y = y 
=I j (OGO gadr- f Gorred (2.19) 
= t(x)G(x) "2 — t(y)G(y)*. 
Ostatnią równość otrzymujemy stosując do ostatniej z całek wzór na całkowanie przez części. 
Pokażemy teraz, że lim,_,g- t(y)G(y)**? = 0. Jeżeli lim,. ,g- T(y) < ©, to przy spełnionym 
warunku (2.12) oczywiście lim,_„g- t(y)G(y)%+2 = 0. Jeżeli lim,_„g- T(y) = ©, to biorąc pod 


uwagę warunek (2.10) oraz założenie 0 < %41 < Y,42, dla dostatecznie dużych y mamy 


0< 10) <EO)GU)" = EoJenn(— | A ar), 


Korzystając zatem z warunku (2.13), otrzymujemy również w tym przypadku, ze 
lim,_„g- T(y)G(y)"*2 = 0. Przechodząc w do granicy, gdy y dąży do B otrzymujemy 
równość 
Yoo [no h(t)G(t) 2! g(t) dt = 1(x)G(x) 2. 
Stąd i z dostajemy, że funkcja T spełnia równanie regresji (2.18). 
Analogiczne obliczenia przy zastosowaniu (2.16) zamiast (2.17) oraz bezpośrednio wa- 


runku (2.13) prowadzą z kolei do równości 
Eer O Tr =x), xe(a,B). (2.20) 


Łącząc teraz równości (2.18) i (2.20), na mocy Lematu|I.1] dostajemy równanie regresji (2.15) 
yo), y+?) 


dla uogólnionych statystyk porządkowych z rozkładu G z odstępem 2. 


Uwaga 2.2. Zgodnie z Lematem[1.3[v) wiemy, że jeśli h(B) < œ% oraz 6 jest zadana przez (2.15), 
to E(B) < œ, a więc również T(B) < œ oraz (p) = t(B) = h(B). Jednakże, w założeniach 
Lematu warunek ten nie występuje. Stąd powstaje pytanie, czy warunek ten jest również 


potrzebny. Pokażemy, że z założeń Lematu 2.1|wynika, że 
jeśli h(B) < =, to $(B) = t(B) = h(B). (2.21) 
Zauważmy, że jeśli h(B) < o, to na mocy otrzymujemy dla a <x<y<B 
TA)G(x)*+ — t(y)G(y)" < h(B)Y-+2 f KOLON 
= h(B)[G(x)" — G(y)*+], 


gdzie oczywiście G jest dana wzorem (2.16). Skoro lim,, „g- t(y)G(y)"*2 = 0, to z powyższej 


nierówności wynika, że dla a < x < B 
T(x)G(x)" < h(B)G(x)*+2 
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(bo G(y)7+2 + 0, gdy y > B”). Z definicji a i B mamy G(x) € (0,1) dla x € (œ,ß), a więc 


dzieląc stronami otrzymamy 
T(x) <h(B), dlaxe€ (a,5). 


Zatem r(B) <œ, a więc T(P) < h(B). Z drugiej strony, na mocy własności T > h na (a,B), 
otrzymujemy t(B) > h(B). Zatem, jeśli h(B) < œ, to r(B) =h(B). 
Analogicznie, z dowodu równości (2.20) wynika, że jeśli r(B) < œ, to dla a <x<y<B 


mamy 


(GA e ś BIG ="GN)"H]. 
Zatem, jeśli t(B) < e, to $ (B) = T(B). To dowodzi prawdziwości implikacji (2.21). 


Przejdźmy teraz do sformułowania i dowodu pierwszego głównego wyniku tego rozdziału. 
Lemat]2. I|pokazuje, że każde rozwiązanie T opisane w punkcie (b) tego lematu generuje pewien 
rozkład prawdopodobieństwa G (zależny od T), dla którego odpowiednia regresja o odstępie 2 
jest równa danej funkcji 6, niezależnie od wyboru T. Fakt ten wykorzystamy w dowodzie po- 


niższego twierdzenia. 


Twierdzenie 2.1. Dla ustalonej liczby naturalnej r > 1, niech xoy bedą uogólnio- 


nymi statystykami porządkowymi z absolutnie ciągłego rozkładu F: (a,B) + (0,1) o cią- 


głej funkcji gęstości. Załóżmy, ze h: («,B) — R jest funkcją ściśle rosnącą, ciągłą i taką, że 


E a(x?) < co, Wówczas różniczkowalna w sposób ciągły funkcja regresji 6: (a,B) > R 


określona wzorem 


E(x)=E (h (xe) xP = x) (2.22) 


jednoznacznie charakteryzuje rozkład F mający ciągłą funkcję gęstości wtedy i tylko wtedy, 
gdy równanie różniczkowe ma dokładnie jedno rozwiązanie y = Q(x) spełniające warunki 
(2.10)—(2.13) z T zastąpionym przez Q. Ponadto funkcja rozkładu F określona jest wówczas 


(t) 
— g(t) p(t) 


— hy Yr-+2" 


gdzie 1 (t) 


Dowód. W dowodzie twierdzenia, bez zmniejszenia ogólności, przyjmujemy, ze %41 < Yr--2> 
gdyż wartości funkcji (2.22) nie zależą od kolejności parametrów Y,4-1, %+2 (zob. Uwaga|1.2). 
Załóżmy, że dana jest regresja i zdefiniujmy 


Q(x) =E (h (x977) xe = x) | (2.24) 
Wtedy na mocy Wniosku I. I|dla £ = 2 (patrz z @ = h) otrzymujemy 
E(x) =E (px) | xi”) = x) | (2.25) 
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Ponieważ funkcja Q określona wzorem jest funkcją regresji kolejnych uogólnionych sta- 
tystyk porządkowych, to spełnia ona warunki (2.11)-(2.13) będące odpowiednikami warun- 
ków (2.6)-(2.8). Co więcej, stosując dwukrotnie Lemat [L.2fiii) dostajemy 6 > @ > h na prze- 
dziale (a, B), a więc spełniony jest warunek (2.10). Ponieważ funkcje @ i € są dwiema funk- 
cjami regresji kolejnych uogólnionych statystyk porządkowych z rozkładu określonego przez 
dystrybuantę F z ciągłą funkcją gęstości, to obie są różniczkowalne w sposób ciągły. Stosując 
tożsamość do oraz otrzymujemy dwa równania 


g'(x) = %+2[9(x) — h(x - > 
6 (x) = tril) — 
Zdefiniujmy pomocniczą funkcję n: (a,B) — R następująco 
— 56) , 90) (2.27) 


Vr+1 Vr+2 


c (a, B). (2.26) 


Dzielac pierwsze równanie w (2.26) przez %42, a drugie przez Y,11, a następnie sumując stro- 
nami równania dostajemy r'(x) = [6 (x) — h(x)]H'(x). Teraz podobnie jak dla przypadku £ = 1, 


dzieląc obie strony przez 6 — h, a następnie całkując stronami względem x wyznaczamy funk- 


«=f ate dt, x€(a,B). 


Powyższa równość T wzór (2.23). 


cję H 


Potraktujmy teraz (2.26) jako układ dwóch równań z dwiema nieznanymi funkcjami @ i H. 
Eliminując H z układu równań otrzymujemy 
/ t 
WA. aga SC). 
%+219 (x) — A(x)] %+115 (x) — o (x)] 


a stąd wynika, ze funkcja p określona przez spełnia równanie różniczkowe (2.9). Po- 


nadto, z powyższych rozważań wynika, że funkcja @ spełnia również warunki (2.10)—(2.13). 
Zatem, jeżeli € jest funkcją regresji daną wzorem (2.22), to @ jest rozwiązaniem równania 
różniczkowego (2.9) spełniającym warunki (2.10)—(2.13p. 

Z drugiej strony, na mocy Lematu [2.1] każde rozwiązanie problemu różniczkowego (2.9)- 
definiuje przy użyciu wzoru pewien ciągły rozkład prawdopodobieństwa F z cią- 
głą funkcją gęstości, dla którego regresja uogólnionych statystyk porządkowych jest określona 
wzorem (2.22). Tak więc liczba rozwiązań problemu różniczkowego pokrywa się z liczbą ab- 
solutnie ciągłych rozkładów prawdopodobieństwa charakteryzowanych przez regresję 6 okre- 
śloną wzorem (2.22). Jeżeli zatem problem z warunkami (2.10)—(2.13) ma jednoznaczne 
rozwiązanie T, to T pokrywa się z @ danym przez i F jest jednoznacznie określona 
przez (2.23). W przeciwnym razie istnieją co najmniej dwa różne rozkłady, dla których za- 
chodzi (2.22). To kończy dowód. 

Twierdzenie 2.1|daje się uogólnić na przypadek regresji z dowolnym odstępem £ > 2. 
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Twierdzenie 2.2. Dla ustalonych liczb naturalnych r > 1, £ > 2, niech xy) „xt będą uogól- 


nionymi statystykami porządkowymi z absolutnie ciągłego rozkładu F : («,B) + (0,1) o cią- 


głej funkcji gęstości. Załóżmy, ze h: («,B) — R jest funkcją ściśle rosnącą, ciągłą i taką, że 


E ja(xet)| < œ, Wówczas różniczkowalna w sposób ciągły funkcja regresji 6: (a, B) > R 
określona wzorem (1.11) jednoznacznie charakteryzuje rozkład F mający ciągłą funkcję gęsto- 
Sci wtedy i tylko wtedy, gdy problem (układ £ — 1 równań różniczkowych) 


1 Vrti+l VI JIH pr z 
i= x), 1<i<@-1, 2.28) 
Ha EG-x © 
gdzie ye = h ma dokładnie jedno rozwiązanie Q = (Q,..., Qr_1) spełniające warunki 
h(x) < pr_1(x) <... < px) < E&x), xe(a,B), (2.29) 
SES 
TT dt < », x€(a,$), (2.30) 
l 0-00 a 
Eo o 
TT dl = », 2.31) 
l 0-00 i 
_ g(t) 
x t 
lim ¢(x) ex -f aw") = (0. 2.32 
Ponadto funkcja rozkładu F określona jest wówczas wzorem 
* 10) ) 
F(x) =1—ex -f A l. 2.33 
01-20 (- | GH sA 
gdzie 
E(x) A 
x)= = +} ——. (2.34) 
n( ) Yr+1 Ł Yr+i+1 


W dowodzie twierdzenia pomocny jest następujący lemat będący uogólnieniem Lematu 2. I] 


Lemat 2.2. Dla ustalonych liczb naturalnych r > 1, £ > 2, niech Y,...,y, > O będą dowolnymi 


parametrami oraz O < Y1 < Y-+i, 2 <i < £. Przypuśćmy, że 


(a) h,Ę: (a,B) > R są funkcjami Ściśle rosnącymi, ciągłymi i takimi, ze h(x) < &(x) dla 


x € (a,B), a ponadto funkcja © jest różniczkowalna w sposób ciągły, 

(b) T=(1q,...,Ty_1) jest dowolnym rozwiązaniem układu równań różniczkowych (2.28) speł- 
niającym warunki (2.29), (2.30), (2.31) oraz (2.32) z @ zastąpionym przez T. 

Wtedy wzór 


G(x) = 1 — exp (- zza): x € (a,B), 


z funkcją n określoną wzorem (2.34) (z Q zastąpionym przez T), określa absolutnie cią- 
głą dystrybuantę z ciągłą funkcją gęstości taką, że dla uogólnionych statystyk porządkowych 


tl A PE: ee 
yO yet ) z parametrami Y,..., Y+¢ z rozkładu G zachodzi równość 


E(x) =E (at) BA =a); x€(a,B). 
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Dowód lematu przeprowadza się analogicznie jak dowód Lematu 2.1] który jest jego szcze- 


gólnym przypadkiem dla £ = 2. W tym celu wystarczy dowodzić kolejno równości 
7; (x) =H (tni (yS D) | yt) = x) , 


gdzie Tt = h, To = 6, począwszy od i = £— 1 do i = 1. Równoważnie 


- B - 
TGA = roi [tas GO gledr, 


dla x € (a,B). W dowodach tych równości korzystamy z faktu, że 
: R T(t) ) 
lim 7;(x) ex -f —— dt | =0, 
x>p- © P( a T(t) — T+1(t) 


co wynika z założenia (2.32) oraz nierówności 0 < 41 < %+i, dla 2 <i < £. Istotnie, dla 


i=0,1l,...,/— 1, mamy na mocy równań (2.28) 


SĄ SĘ (- = J, T(t) © a) | 


Zatem dla dostatecznie dużych x 


0 < 7;(x) exp (- f wee") = qG(x)G(x)F++! 


a T(t) — Tiy (t) 


K E(x) G(x)! = E(x) exp (- f Wenn") | 


co dąży do 0 na mocy (2.32). 

Dowód Twierdzenia Załóżmy, że zachodzi równość regresji i oznaczmy @ = h. 
Następnie rozważmy funkcje Q,, 0 < i < £— I, określone równością (1.19). Wówczas z Wnio- 
sku [1.1] otrzymujemy = E. Co więcej, ponieważ każda funkcja @; jest funkcją regresji ko- 
lejnych uogólnionych statystyk porządkowych, Ściśle mówiąc regresją @;+1 29) wzglę- 
dem x, to każda funkcja @; jest różniczkowalna w sposób ciągły. Każda z tych funkcji speł- 
nia warunki analogiczne do (2.6)—f2.8), w szczególności spełnione są warunki (2.30)-(2.32). 
Ponadto na mocy Lematu [1.2fiii) mamy 941 < Q; na przedziale (a,B) dla0 < i< @—1.Zatem 


zachodzi nierówność (2.29). Dalej funkcje te spełniają £ równań różniczkowych (patrz równa- 


nie (2.4) dla £ = 1) 


Pi (x) = riri Gila) — Pi1(0)]H' (2), O<I<L-1L. (2.35) 


Podobnie do (2.27) określmy teraz funkcję q: (a,B) % R wzorem (2.34). Dzieląc i-te 


równanie w (2.35) przez Y,4;41, a następnie sumując wszystkie równania otrzymujemy 


n' (x) =|[6(x) —h(x)]H'(x), a więc ponownie funkcję rozkładu F można wyrazić w po- 


staci (2.33). 
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Zauważmy, że (2.35) jest układem / równań z / nieznanymi funkcjami Qr,...,Q,-1 oraz H 
(przypomnijmy, że Qy = 6 oraz Q, = h są znane). Aby wyeliminować H wyznaczmy tę funkcję 
z każdego równania otrzymując 


H (x) , 1<i<£l-l]1, (2.36) 


© YP) Pa E) 
oraz 

E'(x) 
Ml6 (x) — i] 


Porównując teraz prawą stronę ostatniego równania z prawą stroną równań (2.36) widzimy, ze 


H (x) = 


funkcje Q1,...,@e_1 spełniają układ £— 1 równań 


Vit PI) — Pi+1(X) p, 

p; (x) = "I; 
ra 60-06) © 
eat Q- — h(x) „, 
P(x) = 5 (x) 
w +1 §(x) — 9i(x) 
Z powyższych rozważań funkcje te spełniają również warunki (2.29)-(2.32). W drugą stronę 
dowód wynika z Lematu|2.2) tak samo jak w dowodzie Twierdzenia 2. I] 


dla 1 <i<£—2, 


Uwaga 2.3. Oczywiście dla £ = 2 układ (2.28) redukuje się do jednego równania różniczko- 
wego (2.9). Dlatego też Twierdzenief2. I|jest szczególnym przypadkiem Twierdzenia [2.2] 


2.2 Jednoznacznos¢ charakteryzacji — szczególne przypadki 
dla /-=2 


W poprzednim podrozdziale sformułowaliśmy kryterium jednoznaczności charakteryza- 
cji absolutnie ciągłych rozkładów prawdopodobieństwa w terminach równań różniczkowych. 
Mimo że otrzymane kryterium jest zaskakująco proste, okazuje się trudne w zastosowaniu na- 
wet dla szczególnych funkcji h i 6. Największa trudność wynika z nałożonych ograniczeń na 
rozwiązania nieliniowych równań różniczkowych. Warunki ograniczające nie mają klasycznej 
postaci typu y(x0) = yo, jak w problemie Cauchy’ ego, którego jednoznaczność rozwiązania jest 
dobrze znana, ale na przykład dla £ = 2 mamy warunek ograniczający w postaci nierówności 
h(x) < y(x) < é (x) dla x € (a,B). 

Do końca tego rozdziału zajmujemy się problemem charakteryzacji z wykorzystaniem no- 
wego kryterium dla regresji z odstępem £ = 2. Wykażemy jednoznaczność charakteryzacji w na- 


stępujących szczególnych przypadkach: 
(i) h jest funkcją ograniczoną z góry, a więc h(B) = lim, „g- h(x) < oe; 


(ii) A(x) = x oraz 6(x) — h(x) +0, gdy x + ©; 
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(iii) A(x) = x oraz (x) = ax + b dla pewnego a > 0. 


W dowodach przedstawionych w niniejszym podrozdziale będziemy stosować na- 
stępujące rozumowanie: funkcja Q określona wzorem (2.24) spełnia wszystkie wa- 
runki (2.9), (2.10), (2.11), i (2.13), a ponadto w każdym z rozważanych przypadków 
szczególnych nie istnieją żadne inne rozwiązania równania różniczkowego spełniające 
warunek (2.10). Zatem @ jest jedyną funkcją mającą żądane własności oraz na mocy Twierdze- 
nia[2. I|rozkład F jest wówczas wyznaczony jednoznacznie wzorem (2.23). 


2.2.1 Własności rozwiązań pomocniczego problemu różniczkowego 


W niniejszym podrozdziale zbadamy własności rozwiązań następującego problemu różnicz- 
kowego 
1 y—h(x) 


EG)—y° 0. x € (a,B), (2.37) 


h(x) < y(x) < (x), 
gdzie y jest dowolną liczbą dodatnią. 
Przy założeniu, że funkcje € i h są ściśle rosnące, z warunku h < y < 6 wnioskujemy, 
że y (x) > O dla każdego x € (a, B). Zatem każde rozwiązanie problemu jest również 
funkcją Ściśle rosnącą. Poniższy lemat podaje inne istotne w dalszej części pracy własności 


rozwiązań tego problemu. 


Lemat 2.3. Niech h, 6: (a,B) R będą funkcjami ściśle rosnącymi i takimi, że h jest ciągła, 


é jest różniczkowalna oraz h(x) < 6(x) dla x € (a, B). Załóżmy, że y > O oraz g,y: (a,B) — R 
są dwoma różnymi rozwiązaniami problemu różniczkowego (2.37). Wtedy 


(i) y(x) £ p(x) dla kazdego x € (a,B); 
(ii) albo y < 9, albo y > Q na przedziale (a, B); 
(iii) jeżeli y > Q, toy’ > ©! oraz jeżeli y < Q, to y! <Q’; 
(iv) jeżeli z = (y— 9)”, to z jest funkcją ściśle rosnącą na (a,B). 
Dowód. Niech D = £(x,y): a < x < B, h(x) < y < 6(x)). Dla dowolnie wybranego xo € (œ, B) 


oznaczmy Qy = (xo). Wybierzmy £ > 0 tak małe, aby kula B = B ( (x0, Qo),€) C D. Rozważmy 
funkcję K: D + (0,%) zdefiniowaną następująco 


y—h(x) 


KG») = rzy 10) 


Wówczas równanie różniczkowe (2.37) można zapisać jako y' = K(x,y). Zauważmy również, 


że pochodna 
OK E(x) —h(x 


dy (E(x) —y) 
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$ (x) 


jest ograniczona w B, a więc K spełnia warunek Lipschitza ze względu na y w zbiorze B. Na 
mocy twierdzenia Picarda zagadnienie y’ = K(x,y), y(xo) = po ma jednoznaczne rozwiązanie 
w przedziale (xo — 6,x9 + ô) dla pewnego 6 > O wystarczająco małego. Oczywiście rozwiązanie 
to musi pokrywać się z funkcją @ na tym przedziale. Zatem jeżeli y jest innym rozwiązaniem 
równania (2.37), to y(x0) # p(x0), co kończy dowód punktu (i). 

Aby wykazać punkt (ii) wystarczy zauważyć, że @ i y są różniczkowalne, a zatem ciągłe. 
Skoro ich różnica zawsze jest różna od zera, to albo jest dodatnia, albo ujemna na całym prze- 
dziale (a,B). 

Aby wykazać punkt (iii) obliczymy pochodną różnicy y — 9 

y—g'= y Va PE —h) El 
(5 —y)(6 — 9) 
Ponieważ h < ọ < & ih <y < ¢&, to oczywiście y > g',gdyy> porazy<g,gdyy<og. 


(iv) Wyznaczając pochodną funkcji z = (y — 9)”, a następnie korzystając z punktu (iii) lub 
nierówności h<p<$5ih<y<$ otrzymujemy 


I I 1 m 3 =h) I 


Zatem z jest funkcją Ściśle rosnąca. 


Na koniec tego paragrafu rozważymy możliwość podania dokładnego jawnego rozwiąza- 
nia problemu różniczkowego (2.37). Rozpatrzmy równanie Abela drugiego rodzaju, które ma 


następującą ogólną postać (por. [48], Rozdział 0.1.6) 


b+s(9]y = flx)y? + f(x)y + fox). (2.38) 


Przepisując w następującej postaci 


(y—&)y! =-y6y+yh6' (2.39) 


widzimy, że jest to równanie Abela drugiego rodzaju z g = —6, fo = 0, fi = —y6' oraz 
fo = yhé'. Rozwiązania wielu szczególnych przypadków równania można znaleźć 
w Rozdziale 1.3 w wyżej wspomnianej monografii [48]. Podstawiajac teraz w = y— € możemy 
przekształcić równanie do postaci 


ww = F(x)w+ Fo(x), (2.40) 


gdzie F; (x) = —(7+ 1)6' i Fy(x) = —Y(6 — h)’. Również różne przykłady równań w po- 
staci (2.40) są rozważane w (patrz Rozdział 1.3.3). Kolejna zamiana zmiennych 


z= | Fils)ar=—(7+ E00), 


Z 
ŁA 


y+1 


lub równoważnie x = ¢7! (— ), prowadzi do równania różniczkowego 
ww, —w = G(z), (2.41) 
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gdzie w, oznacza pochodną funkcji w względem z oraz 
Y Y -1 ( z ) 
Giz)== — ho ——— |. 
o=- yates Uy 


Rozwiązania szczególnych równań tej postaci są rozważane w Rozdziale 1.3.1 w monogra- 
fii [48]. Jednakże wszystkie przedstawione rozwiązania równań (2.38), (2.39), jak i (2.41) nie 


są podane w postaci jawnej, nawet dla szczególnych przypadków. Stąd też trudno zweryfikować, 


czy spełniają warunek początkowy (2. 10) lub zastosować je do wyznaczenia funkcji rozkładu ze 
wzoru (2.23). Dlatego wydaje się, że wyniki przedstawione w nie są pomocne w naszych 


rozważaniach. 


2.2.2 Jednoznacznosé¢ charakteryzacji dla h(B) < © 


Korzystając z Lematu wykażemy jednoznaczność charakteryzacji absolutnie ciągłych 
rozkładów prawdopodobieństwa przez regresje uogólnionych statystyk porządkowych w przy- 
padku, gdy £ = 2 oraz funkcja h jest ograniczona z góry, a więc h(B) < œ. Przypomnijmy, że 
na mocy Lematu|1.3[v), gdy h(B) < œ, to E(B) =h(B) < ». 


Twierdzenie 2.3. Dla ustalonej liczby naturalnej r > 1, niech x gl) będą uogólnionymi 


statystykami porządkowymi z absolutnie ciągłego rozkładu F o ciągłej funkcji gęstości. Załóżmy, 


że h: (œ, B) > R jest funkcją ściśle rosnącą, ciągłą i taką, że h(B) < © oraz Ejh(x(*7) | < o, 


Jeżeli znamy regresję 
El) =E (ha?) XP =x), xe (aB), 


która ma ciągłą pochodną, to wzór (2.23) wyznacza jednoznacznie rozkład F z ciągłą gesto- 
ścią f. 

Uwaga 2.4. Nie zakładamy, że h jest funkcją ograniczoną z dołu i dlatego istnienie 
E |h a | musimy założyć dodatkowo. W Przyktadach]3. 1|i[3.2}pokazemy, ze mozliwe jest, 
ze h(a) =—«. 


Yr+2 
Wi? 
przez (2.24) jest rozwiązaniem równania różniczkowego spełniającym warunki (2.10)— 
(2.13). Naturalnie @ jest także rozwiązaniem problemu (2.37) z y = aT Przypuśćmy, 
że istnieje również inne rozwiązanie y tego problemu. Wówczas dla z = (y— 9)? mamy 


Dowód. W niniejszym dowodzie stosujemy Lemat|2.3|z y= Wiemy już, że Q określona 


0 <z(x) < [6(x) —A(x)}*, czyli lim; „g- z(x) = 0. Z drugiej strony z(œ) > 0 oraz na podsta- 
wie Lematu [2.3[iv), funkcja z jest Ściśle rosnąca. To daje sprzeczność. Zatem @ jest jedynym 
rozwiązaniem równania różniczkowego spełniającym żądane warunki. Teza twierdzenia 
wynika teraz z Twierdzenia 2. I] 
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Uwaga 2.5. Przypuszczamy, że prawdziwe jest uogólnienie Twierdzenia [2.3|]na przypadek do- 
wolnego £ > 3, ale nie znaleźliśmy na to formalnego dowodu. Mianowicie dla dowolnego £ > 3, 
jeżeli h(B) < ©, to regresja określa jednoznacznie funkcję rozkładu F wzorem (2.33). 
To przypuszczenie jest poparte faktem, iż w literaturze nie są znane przykłady niejednoznacz- 
ności dla takiego przypadku. Aby udowodnić to uogólnione twierdzenie wystarczyłoby uogól- 
nić Lemat [2.3{i) oraz (iv), tj. wykazać, ze jeżeli y = (y1,...,ye_1) oraz @ = (Qy,...,Pr_1) 
są dwoma rozwiązaniami uogólnionego problemu (2.28), to te rozwiązania nie maja punktów 
wspólnych oraz odległość (euklidesowa) tych rozwiązań jest funkcją rosnącą. Pierwsze zadanie 
nie jest trudne, ale drugie wydaje się być problematyczne. Przypuśćmy, że y = (y1,.--,ye—-1) 
oraz @ = (Qi,...,P(-1) sa dwoma rozwiązaniami problemu i określmy 


l-1 
z= |ly— 9l? = X 0i- p. 


i=1 
Zatem pochodna funkcji z jest następująca 


l-1 , a ABY 
zł oe! Yr+i+1 1— 0, G Yi+1 Qi p . 
$ d Yrt+1 0179) -yı E- ọỌı 


Jeżeli £ = 2, to y2 = Q) = h oraz powyższy problem sprowadza się do Lematu [2.3fiv), w którym 
wykazaliśmy, że z > 0. Jednakże dla £ > 3 nie znajdujemy argumentów, które świadczyłyby, 
że z” jest większe od zera, co oznaczałoby, że odległość między y i @ rośnie. Zatem dla £ > 3 


problem pozostaje wciąż otwarty. 


2.2.3  Jednoznaczność charakteryzacji dla h(B) = » 


W niniejszym paragrafie rozważamy przypadek, gdy funkcja h jest nieograniczona. Przyj- 
mujemy dla uproszczenia (bez straty ogólności rozważań), że h(x) = x, a zatem dla funkcji 
nieograniczonej mamy B = œ oraz h(B) = ». W takim przypadku nie możemy zastosować 
Twierdzenia|2.3|w celu wykazania jednoznaczności charakteryzacji rozkładu prawdopodobień- 
stwa przez funkcję regresji € daną wzorem (2.22). Jednakże analizując dowód Twierdzenia|2.3] 
widzimy, że jeśli 

lim [& (x) — h(a] = 0. (2.42) 
to również zachodzi jednoznaczność charakteryzacji. W praktyce trudno jest obliczyć funkcję 
regresji č, a więc nie jest łatwo sprawdzić czy warunek jest spełniony. Wykażemy jed- 
nakże, że dla dużej klasy rozkładów można ten warunek zweryfikować jedynie na podstawie 
znajomości funkcji intensywności awarii tych rozkładów, bez konieczności obliczania regre- 
sji č. Przypomnijmy, że funkcja intensywności awarii A jest określona wzorem (2.1). 


Lemat 2.4. Jeżeli h(x) = x, B =~ oraz lim A(x) = ©, to spełniony jest warunek (2.42). 


X—>0%0 
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Dowód. Wychodząc od równości (2.3) warunki (2.24) oraz (2.25) możemy odpowiednio zapi- 


sać w postaci 


m Vr+2 = B4\%+2—-1 
00) = Bigs | Horo roa (2.43) 
oraz 
6 (x) = Sars , POEA F) dr. (2.44) 


Całkując przez części prawą stronę równania (2.43) otrzymujemy 
1 OP 
= Vr+2 
Q(x) = h(x) + Fare 7 F(t)? dt. 


Następnie, korzystając z reguły de 1 Hospitala obliczamy granicę 
1 1 
lim |@(x) — hA(x)| = — lim ——~ =0. 
Jim[9(x) —h@)] = —— lim zo 
Podobnie z (2.44) otrzymujemy 


1 98 
EW KO) + zoo jj Fae 


+ AI | (for F(u y+ au) F(t)" Y-+2= 1 f(t)dt 


x) + 1 


i ponownie stosując regułę de l’ Hospitala dostajemy 


santo) a= (+5) imę =? 


To kończy dowód. 


Wniosek 2.1. Jeżeli lim A(x) = ©, to ciągły rozkład F z ciągłą funkcją gęstości jest określony 


X—>00 


jednoznacznie przez regresję (x) = E (x?) | xl” =x). 


2.3 Przykłady i zastosowania 


2.3.1 Regresje o odstępie dwa 


W tym paragrafie wykorzystamy wyniki otrzymane w poprzednich podrozdziałach do otrzy- 
mania nowych charakteryzacji rozkładów absolutnie ciągłych. W poniższych przykładach, dla 
uproszczenia obliczeń, rozważamy funkcje regresji wartości rekordowe R,., r > 1, ciągu nieza- 
leżnych zmiennych losowych o jednakowym rozkładzie określonym przez funkcję gęstości f. 
Wiemy, że rekordy są uogólnionymi statystykami porządkowymi z parametrami y; = 1, j > 1 
(zob. podrozdziat{I.1.3). Korzystając z równości w połączeniu z równaniami i 
regresję Ś (x) = E(R,+2 | R, = x) możemy przedstawić w postaci 


(2.45) 
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gdzie funkcja p(x) = E (R,+2 | Rr+1 = x) jest zdefiniowana następująco 


B 
pas Fay / f(t) de. (2.46) 


W pierwszym przykładzie pokażemy nową charakteryzację pewnego rozkładu beta. Roz- 
kład Beta(a,b) określa funkcja gęstości postaci 


1 
fæ) = zan l =„7 1, 0<x<1, a,b>0, 


gdzie B oznacza funkcję beta Eulera. 
Przykład 2.1. Dla rozkładu Beta(2,2) z gęstością f(x) = 6x(1 — x), 0 < x < I, otrzymujemy 


1+2x + 3x7 
p(x) = E (Rr42 | Rr+1 =x) = “2(1 + 2x) 


W konsekwencji z (2.45) po żmudnych obliczeniach wykazujemy, ze 


2(1 —x)(26 — x+ 2x? — 18x3) + 27log (37) 


32(1 —x)2(1 + 2x) a 


E(x) = E(R,42 | Rn, = x) = 


Oczywiście dla badanego rozkładu mamy B = 1 i h(x) = x, a więc h(B) < o. Zatem, na mocy 
Twierdzenia |2.3|rozkład Beta(2,2) jest jedynym rozkładem, dla którego zachodzi warunek re- 
gresji wartości rekordowych (2.47). 


Do końca tego paragrafu będziemy rozważać problem jednoznacznej charakteryzacji popu- 
larnych rozkładów prawdopodobieństwa przez odpowiadające im regresje uogólnionych staty- 
styk porządkowych, mimo że nie znamy analitycznej postaci tych funkcji. Istnienie odpowied- 
nich funkcji regresji dla rozważanych poniżej rozkładów prawdopodobieństwa wynika z istnie- 
nia momentów tych rozkładów oraz twierdzenia o istnieniu momentów uogólnionych statystyk 
porządkowych z tych rozkładów (zob. [20], Twierdzenie 2.2). 

Kolejny przykład dotyczy charakteryzacji rozkładu normalnego. 


Przykład 2.2. Rozważmy rozkład normalny N(u,o?) z parametrami u € R, o > 0, określony 


przez następującą funkcję gęstości 


a. (x) 
A= zw ( 92 , xER, ueR,o>0. 


Funkcja F wyraża się następująco 


F(x) = = = [ex CS) dt. 


Korzystając z reguły de |’ Hospitala łatwo dostajemy A (x) — œ, gdy x — œ. Teraz biorąc pod 


uwagę Wniosek [2.1] stwierdzamy, że rozkład normalny jest jednoznacznie charakteryzowany 
przez odpowiadającą mu regresję uogólnionych statystyk porządkowych, mimo że nie znamy 


analitycznej postaci funkcji 6. 
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Uwaga 2.6. Można łatwo sprawdzić, że warunek lim A (x) = œ zachodzi również m.in. dla 
X—>00 


rozkładu Weibulla z parametrem kształtu 6 > 1 oraz rozkładu Gompertza. Istotnie: 


e rozkład Weibulla z parametrami 6,0 > 0, a € R, dla którego 


f(x) = 60(x—a)® exp |-0¢œ- a” , F(x)=exp |-80— a)? , x>a, (2.48) 
ma potęgową funkcję intensywności awarii 
A(x) = 80 (x — a). 


Dla 6 > I mamy A(x) > ©, gdy x > ©, a więc jest to sytuacja analogiczna jak w Przykta- 
dzie|2.2] Natomiast dla 0 < 6 < I mamy A (x) + 0 oraz dla 6 = 1 (rozkład wykładniczy) 
mamy A(x) = 0. 


e rozkład Gompertza z parametrami 6,0 > 0, dla którego 


f(x) = 6 exp(@x) exp $ [1 ~exp(6x)] , F(x) =exp $ [1 ~ exp(6)] + x>0, 
ma wykładniczą funkcję intensywności awarii 
A(x) = Oexp(0x). 
Oczywiście A (x) > ©, gdy x > œ. 


Zatem na mocy Wniosku [2.1] rozkłady te również są jednoznacznie charakteryzowane przez 
odpowiadające im funkcje regresji uogólnionych statystyk porządkowych o ostępie dwa (£ = 2). 
Jednakże nie udało nam się znaleźć analitycznych wzorów tych regresji. 

Z drugiej strony warunek z Wniosku nie zachodzi na przykład dla rozkładu gamma, 
Weibulla z 6 < 1 (w szczególności dla rozkładu wykładniczego, 6 = 1), Pareto oraz rozkładu 
logarytmiczno-normalnego. Zatem na pytanie, czy te rozkłady są jednoznacznie charakteryzo- 
wane przez regresje uogólnionych statystyk porządkowych nie możemy odpowiedzieć korzysta- 
jąc z wyników zaprezentowanych w podrozdziale [2.2] Do tego problemu wrócimy w kolejnym 


rozdziale. 


2.3.2 Regresja liniowa 


W tym paragrafie rozpatrzymy klasyczny problem charakteryzacji rozkładów prawdopodo- 
bieństwa przez liniowe regresje uogólnionych statystyk porządkowych z perspektywy nowego 
kryterium jednoznaczności charakteryzacji otrzymanego w podrozdziale [2.1] 

Załóżmy najpierw, że E (x | x = x) =ax+b dla x € (a,B). Zatem rozwazamy przy- 
padek, gdy h(x) = x i (x) = ax+ b, gdzie a > 0, gdyż z Lematu [1.2|funkeja & jest rosnącą. Co 
więcej, korzystając z i postępując analogicznie jak np. w sekcji 4 w pracy [11], otrzymu- 
jemy, że możliwe są tylko następujące przypadki: 
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(i) jeżeli 0 < a < 1, to B = 7%, oraz bazowy rozkład jest rozkładem potęgowym określonym 


na nośniku (a, B), to znaczy F(x) = (f= =) dla x € (a, B), gdzie 0 = Eo > 0; 


(ii) jeżeli a = 1, to B = œ, b > 0 oraz bazowy rozkład jest rozkładem wykładniczym o nośniku 


(œ,%), to znaczy F(x) = exp[—@(x— @)] dla x > a, gdzie 6 = Fy. ; 


r+ 
(ii) jeżeli a > 1, to œ > 1, P = œ oraz bazowy rozkład jest rozkładem Pareto o nośniku 


(0,0), to znaczy F(x) = EA dla x > a, gdzie 0 = z—jy—; > 0, 5=27>0. 

Powyższe trzy rodziny rozkładów prawdopodobieństwa otrzymujemy również w przy- 
padku ene | > 2. Jeżeli F jest ciągłą funkcją rozkładu na (a,B) oraz zachodzi rela- 
YUNI ) | x — ax”) 


cja E(X. +b dla pewnego a > 0, to wówczas zachodzą tylko następujące 


aan 

(i) O<a<1iF jest funkcją rozkładu potegowego; 
(ii) a= 1 i F jest funkcją rozkładu wykładniczego; 
Gii) a > 11F jest funkcją rozkładu Pareto. 


W każdym przypadku parametry charakteryzujące powyższe rozkłady są jednoznacznie wy- 
znaczone przez a, B, a, b oraz parametry uogólnionych statystyk porządkowych 7,+1,...,%+1¢ 
(zob. [16], Twierdzenie 1 oraz [19], Twierdzenie 5.1). Znany dowód tego wyniku został 
oparty na pomyśle zastosowanym dla regresji statystyk porządkowych i wartości rekordowych 
w i bazuje na rozwiązaniu scałkowanego równania funkcyjnego Cauchy ego [49]. Poni- 
żej korzystając z Twierdzenia(2. I|podamy inny niemal elementarny dowód tego wyniku w przy- 
padku, gdy /=2. 


Załóżmy, ze dla pewnego rozkładu F zachodzi równość 


E(x (r+2) |) x =x) =ax+b, x€(a,B), (2.49) 


dla pewnych stałych a,b € R oraz —» < a < B < œ. Ponadto, dla uproszczenia zapisu przyj- 


mijmy, że y= 7 +. Pokażemy najpierw, że œ > —». Oczywiście (x) = ax + b jest funkcją 


różniczkowalną, a więc na mocy Twierdzenia [2.1]moze ona charakteryzować jedynie rozkłady 
absolutnie ciągłe z gęstością ciągłą na (a, B). Dalej zgodnie z Twierdzeniem|2. 1|szukamy roz- 


wiązań równania 


g'(x) = ay x € (a, B) (2.50) 
takich, że w szczególności 
x<gp(x)<ax+b, xe(a,B) (2.51) 
oraz 
Jazze a <* x€(a,B). (2.52) 
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Jeśli 6 (x) = ax + b ma być regresją, to musi być ściśle rosnąca, a więc a > 0. Jeśli a > 1, to 
warunek 6 (x) > x zachodzi jedynie dla x > E a więc w tym przypadku a > T> > —», 


Jeśli a € (0, 1] oraz Q spełnia (2.50) i (2.51), to 


i dt x dt 
Lano he eA 


Jeśli æ = —oco, to ostatnia całka jest rozbieżna do œ dla każdego x € (œ, ß). Zatem gdyby 
Q = —%, to nie istniałoby żadne rozwiązanie @ równania spełniające jednocześnie wa- 
runki oraz (2.52). Zatem « > —». 

Załóżmy najpierw, że œ = 0, a więc h(x) = x, 6(x) = ax + b dla pewnych a,b > 0 oraz 
x € (0,58). Z własności funkcji regresji (Lemat [1.3) otrzymujemy 


1, gdy 0<a<l, 


P =inf{x > 0: ax+b = x} = 
o0, gdy a>l. 


Nasz pierwszy problem to znaleźć rozwiązanie y takie, że 
y-x 
y= cs a | 
ax+b—y x € (0,5). (2.53) 
x< y(x) <ax+b, 
Sprawdźmy najpierw, czy istnieją liniowe rozwiązania tego problemu postaci 


y(x) =cx+d. (2.54) 


Oczywiście z uwagi na to, że 0=h(0) < y(0) < € (0), mamy d € (0,b). Ponadto jeżeli 0 < a < 1, 
toc < 1, gdyż x < cx+d oraz c > a, gdyż cx+ d < ax+b dla x > O. Podobnie jeżeli a > 1, to 


c > l oraz jeżeli a = 1, to c = 1. Podsumowując, możliwe są następujące przypadki 


ce(a,l), gdyO<a<l, 
de (0,b) oraz c=l, gdya=l, 
ce(l,a), gdya>l. 


Wstawiając a = 1 do (2.53) otrzymujemy y(x) = x+ d oraz 1 = A a ponieważ y > 0, to 


d= TĘ € (0,b). Jeżeli natomiast a Æ 1, to 


cx +d—x 
ax + b—(cx+d) 


c=ay 
lub równoważnie (a—c)cx+ (b—d)c=ay(c— 1)x+ady. To z kolei prowadzi do układu równań 


(a—c)c =ay(c— 1), 
(b—d)c=ady. 


(2.55) 
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Pierwsze równanie jest równaniem kwadratowym względem parametru c 
2 = 
c +a(y-1l)c—ay=0. (2.56) 


Zauważmy, że A = a”(y — 1)? + 4ay > 0, zatem to równanie ma dwa pierwiastki różnych 
znaków. Zdefiniujmy f(c) = c” +a(y— 1)c— ay. Wtedy jeżeli a > 1, to f(1)=l-a<0 
oraz f(a) = ayla — 1) > 0. Zatem równanie kwadratowe ma dokładnie jedno rozwią- 
zanie c w przedziale (1,a). Podobnie w przypadku 0 < a < 1, równanie ma dokładnie 
jedno rozwiązanie c w przedziale (a, 1). Co więcej, dla a 4 1 z równań (2.55) otrzymujemy 
b-d ay a-c 
d c c-l’ 


a zatem 
1 


d= — (0,b). (2.57) 


Podsumowując, jeżeli a > O oraz b > 0, to problem różniczkowy (2.53) ma dokładnie jedno 
rozwiązanie liniowe @(x) = cx+d takie, że: c = 1 i d = TĘ gdy a= 1, w przeciwnym razie 
c jest jedynym dodatnim rozwiązaniem (2.56), a d jest określone przez (2.57). 


Zauważmy, że rozwiązanie liniowe naszego problemu różniczkowego spełnia również po- 
zostałe warunki z Twierdzenia czyli (2.11), (2.12) i (2.13). Mianowicie, jeśli a = 1, to 


p = œ oraz 
[ ae a= SF fa = tre 
o 5(t)— 
Zatem spełnione są warunki (2.11) oraz Tä ). Ponadto 


SML) , 1+yx 
lim é (x) SCJE JĄ E(t) — g(t) t — l(t „ar = lim (ax + b)exp (-—5) = 0, 


a więc zachodzi warunek (2.13). 
Jeśli a £ 1, to b — d = = =e , a zatem 


eet) pe a 
h 0-95" "hCG 


se f dt 
| a—c Jo (a—1)t+b 
a (a—1)x+b 
g : 
a—c b 


Jeśli 0<a< 1, to B = ar oraz a < c < 1, a więc oczywiście zachodzą warunki (2.11) 
oraz (2.12). Ponadto lim, ,5g- (x) = 1, czyli (2.13) oczywiście zachodzi. Jeśli a > 1, to 
B = œ oraz a > c > 1, a więc oczywiście również zachodzą warunki (2.11) oraz (2.12). Po- 


nadto 


a 


E(x) exp (- | zza) (aah (5) LOT 50, 
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gdy x + œ. Zatem i w tym przypadku zachodzi warunek (2.13). 

W następnym kroku musimy wykazać, że problem nie ma innych rozwiązań (rozwią- 
zań nieliniowych). 

Jeżeli 0<a< I, to B= TZ < oo, W tym przypadku jednoznaczność rozwiązania pro- 
blemu przez funkcję liniową wynika z Twierdzenia [2.3] To z kolei implikuje, że 


E (xg) [xf =x) = ex-+d, x€ (0,8), (2.58) 


zc € (0,1), a więc F jest jednoznacznie określoną funkcją rozkładu potegowego na (0, 72). 

Jeżeli a > 1, to mamy B =» i h(B) = ©, tak więc nie możemy zastosować Twier- 
dzenia Stąd naszym kolejnym zadaniem jest wykazać jednoznaczność rozwiązania pro- 
blemu przez funkcję liniową ze współczynnikiem c > 1. W tym celu wyznaczmy 
druga pochodną y, aby wykazać, ze y’ jest albo funkcją rosnącą, albo funkcją malejącą na prze- 
dziale (0, co). 

Załóżmy najpierw, że a = 1. Wtedy mamy szczególne rozwiązanie Q(x) = x+ d oraz jeżeli 
y jest innym rozwiązaniem problemu 


! yx 
= y———, x<y<x+b, 
are Tb=y á 
to y' jest funkcją różniczkowalną i wyznaczając pochodną dostajemy 


H yb ! 
= a —] 4 
+ Gpb=yzU ) 


Dalej korzystając z Lematu[2.3|mamy do rozważenia następujące przypadki: 
e jeżeli y > x+d, to y'> 1 iy” > 0, zatem y’ jest funkcją rosnącą; 
e jeżeli y < x+d, toy’ < 1iy”< 0, zatem y’ jest funkcją malejącą. 


W obu przypadkach istnieje granica lim,_,.. (x) = y'(eo) (być może granica jest niewłaściwa). 


Z warunku x < y < x+ b, dostajemy I < + < 1+$,astąd 


ia 77 
x>% X 
Z reguły de |’ Hospitala mamy również 
Sst Gt EL 
X—p00 X—0 X 


Z drugiej strony, dla każdego rozwiązania y naszego problemu zachodzi tożsamość 


0 
(0) = PO 
b—y(0) 
gdzie y(0) e (0,b). Zatem y'(0) rośnie od 0 do œ, gdy y(0) zmienia się od 0 do b. W szcze- 


b 


gólności y' (0) = I wtedy i tylko wtedy, gdy y(0) = Try = d. Zatem, jeżeli y jest rozwiązaniem 
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takim, że y(0) > d, to y(x) > x+d, y'(0) > 1 oraz y' jest funkcją rosnącą. Wtedy dostajemy 
sprzeczność 
1<y(0) <y(es)=1. 


Podobnie, jeżeli y jest rozwiązaniem takim, że y(0) < d, to dostajemy kolejną sprzeczność 

1 > y(0) > y (eo) = 1. Tak więc, w przypadku gdy a = 1, nie ma innych rozwiązań naszego pro- 

blemu różniczkowego niż 9(x) =x+d, gdzie d = ay To implikuje, ze relacja zachodzi 

zc = l, a więc F jest jednoznacznie określoną funkcją rozkładu wyktadniczego na (0, °°). 
Załóżmy teraz, ze a > 1. Wówczas z y' jest różniczkowalna oraz 


/ 


y 
R 21 —y). 2 
y-x ane y) (2.59) 


Tak więc z (2.59) druga pochodna y jest następująca 


/ 


fp OF |u =) a = 

AE; (y —1)(ax+b— y) — (a m Pe y) =" 
REESE RE ECZIE | 
Sepa +a(y- Dy —ay| B= 


gdzie 
f(x) =x’ +a(y—1)x—ay. 
Wiemy już, że to równanie ma jeden pierwiastek c € (1,a), a drugi pierwiastek tego równania 
jest ujemny. Stąd 
<0, dlaxe(0,c), 


x 
>0, dlax>c. 


Mając na uwadze Lemat|2.3|ponownie z otrzymujemy 
e jeżeli y > ọ, toy’ > ci f(y'(x)) > f(c) =0 dla x > 0, zatem y’ jest funkcją rosnącą; 
e jeżeli y <Q, toy < ci f(y'(x)) < f(c) =0 dla x > 0, zatem y' jest funkcją malejącą. 


W obu przypadkach granica y' (eo) = lim, >»y (x) istnieje (być może niewłaściwa). Z reguły 
de l’ Hospitala granica 


L= lim ya) = lim y (x) 


x>% X 1% 
również istnieje. Z warunku x < y(x) < ax +b mamy 1 <+<a+ b, zatem L jest granicą 


skończoną taką, że 1 < L < a. Przepisując teraz (2.53) w postaci 


a następnie przechodząc do granicy, gdy x % œ dostajemy L = ay. To pokazuje, ze 


Le(1,a), a porównanie z pierwszym równaniem w (2.55) prowadzi do wniosku, ze L = c. 
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Zatem, jeżeli y jest rozwiązaniem naszego problemu z a > 1, to y (eo) = c, gdzie c jest dodat- 
nim pierwiastkiem otrzymanym z równania kwadratowego (2.56). 
Z drugiej strony mamy 
y(0) 
b—y(0) 
Stąd gdy y(0) rośnie od 0 do b, to y'(0) rośnie od 0 do ©. Co więcej, y' (0) = c wtedy i tylko 


y (0) =ay 


wtedy, gdy y(0) = d. Teraz podobne rozumowanie jak dla przypadku a = 1 prowadzi do sprzecz- 
ności. Tym samym pokazaliśmy, że problem różniczkowy ma tylko jedno liniowe roz- 
wiązanie ze współczynnikiem c > 1. To implikuje, że regresja określona przez zachodzi 
z parametrem c > 1, a więc F jest jednoznacznie określoną funkcją rozkładu Pareto na (0,00). 
W ogólnym przypadku, gdy œ > —o jest dowolne, wystarczy zastosować Lemat[1.4|przyj- 
mując g(x) =x— a. Otrzymamy wtedy, że równość zachodzi wtedy i tylko wtedy, gdy 


E 22 | | AŻ =y) = ay +(a—1)a +b 


dla y € (0,B — a), gdzie yo oraz yo są uogólnionymi statystykami porządkowymi z roz- 
kładu G(y) = F(y+@). 


Uwaga 2.7. Jak zaznaczyliśmy na początku tego podrozdziału, liniowa regresja € = ax +b dla 
dowolnego £ > 3 również charakteryzuje bazowy rozkład prawdopodobieństwa jednoznacz- 
nie. Tak więc zgodnie z Twierdzeniem problem różniczkowy dla h(x) = x oraz 
& (x) = ax +b ma jednoznaczne rozwiązanie @ = (Q;,...,Q/_1). Nie jest trudno zauważyć, że 
wówczas Q;(x) = cix+ di, i = 1,...,£ — 1 z odpowiednio dobranymi parametrami cy,...,cę_1 
oraz dy,...,dy_1. Jednakże nie jest łatwo bezpośrednio wykazać jednoznaczność rozwiąza- 
nia @, co stanowiłoby nowy dowód charakteryzacji rozkładów prawdopodobieństwa przez li- 


niową regresję uogólnionych statystyk porządkowych. 


2.3.3 Dyskusja możliwości zastosowań praktycznych 


Na zakończenie tego rozdziału odniesiemy się do możliwych praktycznych zastosowań 
otrzymanych wyników. Z teoretycznego punktu widzenia Twierdzenie |2.3| jest bardzo istotne: 
gdy znamy tylko jedną funkcję regresji uogólnionych statystyk porządkowych, to możemy wy- 
znaczyć bazowy rozkład jednoznacznie. Jednakże praktyczne wykorzystanie tego wyniku może 
być wątpliwe z uwagi na fakt, że w praktyce funkcje regresji między dwiema zmiennymi loso- 
wymi są najczęściej nieznane. Aby zastosować nasze wyniki wymagana jest znajomość anali- 
tycznej postaci regresji. Nie mniej jednak wydaje się, że pewne zastosowania można otrzymać 
korzystając z nieparametrycznych metod estymacji funkcji regresji, które dają zazwyczaj nu- 
meryczną aproksymację wartości regresji w ustalonych punktach. 

Korzystając z tych metod nasz wynik może zostać zastosowany w następujący sposób. Za- 


cznijmy od tego, że wybieramy konkretny model uogólnionych statystyk porządkowych. Roz- 
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ważmy przykładowo zwykłe statystyki porządkowe omówione w podrozdziale|I.1.1] W pierw- 
szym kroku obserwujemy N niezależnych prób losowych o tym samym rozmiarze n. Dla usta- 
lonej z góry liczby r € (1,...,n— 2} obserwujemy dwie statystyki porządkowe X,., oraz X;+2:n- 
W ten sposób otrzymujemy N par (x;, y;), które mogą posłużyć do nieparametrycznej estymacji 
funkcji regresji y = 6 (x) = E (X,+2:n | Xn = x) z wykorzystaniem np. estymatorów jądrowych 
regresji. Oczywiście im większa liczba prób N tym lepsze wyniki aproksymacji funkcji 6. 


Dysponując jedynie estymacją numeryczną funkcji $ odpowiadające równanie różniczkowe 


o = yő' = dla y = nrl możemy rozwiązać również tylko numerycznie. Zatem znajdujemy 
tylko numeryczne przybliżenie funkcji p. W ostatnim kroku korzystając ze wzoru (2.23), catku- 
jąc numerycznie, znajdujemy nieznaną dystrybuantę F bazowego rozkładu. Tak więc, cała pro- 
cedura wymaga dużej liczby obserwacji oraz przeprowadzenia wielu obliczeń numerycznych, 
które prowadzą tylko do przybliżonych wyników. Zatem z powyższych względów praktyczne 


zastosowanie naszych wyników wydaje się raczej ograniczone. 
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Rozdział 3 


Charakteryzacje rozkładów ciągłych przez 
regresje uogólnionych statystyk 


porządkowych 


W poprzednim rozdziale przedmiotem rozważań były charakteryzacje rozkładów absolut- 
nie ciągłych o ciągłej gęstości przez regresje uogólnionych statystyk porządkowych. W takim 
przypadku regresja była funkcją różniczkowalną w sposób ciągły, a kryterium jednoznaczności 
charakteryzacji wyraziliśmy w terminach równań różniczkowych. Jednakże wyniki te nie obej- 
mują nawet najprostszych rozkładów absolutnie ciągłych o nieciągłej gęstości, jak np. rozkładu 


o gęstości 


+, dlax € (0,1), 
f(x)=4$3, dlax€ [1,2], (3.1) 
0, dla pozostałych x, 


rozważanego w Przykładzie w niniejszym rozdziale. Powstaje więc pytanie, czy wyniki 
z poprzedniego rozdziału można uogólnić na klasę wszystkich rozkładów absolutnie ciągłych, 
albo nawet na klasę wszystkich rozkładów ciągłych. 

W niniejszym rozdziale zakładać będziemy, że F jest ciągłą dystrybuantą rozkładu prawdo- 
podobieństwa skupionego na nośniku (œ, 8B). Wówczas na mocy Lematu [1.3|funkeja regresji 6 
jest również ciągła, ale niekoniecznie różniczkowalna we wszystkich punktach. 

W podrozdziale [3.1] podamy uogólnienie kryterium jednoznaczności z rozdziału |2| co sta- 
nowi główny wynik tej części pracy. Następnie w podrozdziale[3.2|skupimy się na wykorzysta- 
niu nowego kryterium do badania jednoznaczności charakteryzacji przez regresje uogólnionych 
statystyk porządkowych o odstępie dwa (£ = 2). Otrzymane wyniki zastosujemy w podroz- 
dziale[3.3|w celu otrzymania nowych charakteryzacji rozkładów ciągłych. 

Przypomnijmy, ze F (x) = 1 — F(x) oraz H (x) = — log F (x). 


51 


3.1 Kryteria jednoznaczności charakteryzacji rozkładów 


ciągłych 


Ze wzoru widzimy, że funkcje regresji kolejnych uogólnionych statystyk porząd- 
kowych (/ = 1) wyrażają się w terminach całki Riemanna-Stieltjesa. Zatem zanim przejdziemy 
do problemu charakteryzacyjnego przypomnimy najpierw pewne własności całki Riemanna- 
Stieltjesa względem funkcji monotonicznych lub funkcji o wahaniu skończonym. Własności te 


będą pomocne w naszych dalszych rozważaniach. 


Lemat 3.1. Niech f i g będą funkcjami ciągłymi na przedziale domkniętym |a,b|, zaś A będzie 


funkcją o wahaniu skończonym na przedziale [a,b]. Zdefiniujmy 
B(x) = f FOA, dlaa<x<b. 


Wówczas B jest również funkcją o wahaniu skończonym oraz zachodzi równość całek 


[een foroa: 

Jest to jedna z podstawowych własności całki Riemanna-Stieltjesa, która w tym rozdziale 
będzie niejednokrotnie stosowana. Elementarny dowód tej własności oparty na sumach całko- 
wych można znaleźć w monografii (patrz Problemy 1.2.26 i 1.3.3). Ponadto zauważmy, 
że powyższy lemat jest szczególnym przypadkiem dobrze znanej własności zwanej absolutną 
ciągłością całki Lebesgue'a względem miary (zob. na przykład [50], Twierdzenie 1.29). 

Kolejny lemat można wyprowadzić jako wniosek ze wzoru na całkowanie przez części dla 


całki Riemanna-Stieltjesa. 


Lemat 3.2. Jeżeli f i g są dowolnymi funkcjami ciągłymi o wahaniu skończonym na przedziale 
[a,b] oraz g(t) >c>Odlaa < t < b, to 
b b ] b f(t 
1 AD fA apo- f IO, ag 
g(b) gla) Ja g(t) a (g(t)) 


Podamy teraz lemat kluczowy dla naszych dalszych rozważań. W lemacie tym zostanie po- 


dana pewna postać funkcji regresji kolejnych uogólnionych statystyk porządkowych z rozkładu 
określonego przez ciągłą dystrybuantę F. 


Lemat 3.3. Dla ustalonego r € N, niech x xt) będą uogólnionymi statystykami porząd- 


kowymi z rozkładu o ciągłej dystrybuancie F: (a,B) — (0,1). Załóżmy, że h: (a, B) — R jest 


funkcją ściśle rosnącą, ciągłą i taką, że E kx) ) | < », Jeżeli 


E(x) =E (a(x) jx” =. x€(a,B), (3.2) 


to 
0) = E00) + [760-460] Fr) 


20 t 
„B) 


Q 7 


, x€(a,B), (3.3) 


gdzie xq jest dowolnie wybranym punktem z przedziału ( 
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Dowód. Ustalmy r € N i dla uproszczenia zapisu przyjmijmy Y = %+1. Wówczas ze 


wzoru (1.22) mamy 


Określmy 
B yee Z 
F =y] KOFWT'dF(li), g(x) = Fa). 
Korzystając teraz z Lematu|3.2]dla dowolnego przedziału |x9,x] C (a,B) mamy 


£0)-600= | arty | heo. GA) 


Dalej z Lematu|3. I|dostajemy 


1 l 1 zma 
| t0- -rf rp OF (l dF (t "m 


+ f 
a= | 507 f E00 
I, (g(t > 
Wstawiając teraz równości (3.5) oraz 35 do FA e dm. dowód a w przypadku, gdy 


(3.5) 


Ponadto 


(3.6) 


xo < x. W przeciwnym Batt wystarczy zamienić rolami xg oraz x, aby otrzymać żądaną 


równość. 


Uwaga 3.1. W Lemacie nie zakładamy, że h(@) > —co, nawet jeśli œ > —». W po- 
niższych przykładach pokażemy, że możliwe jest, że h(a) = lim, ,+h(x) = —», a nawet 
5(a) = lim,_„„+ 6 (x) = —». W przykładach będziemy rozważać statystyki porządkowe, które 
są uogólnionymi statystykami porządkowymi z parametrami y, =n—r+ 1, | Śr <n. Wszcze- 


gólności % = 1. 


Przykład 3.1. Rozważmy statystyki porządkowe X;.,, 1 < r < n, z absolutnie ciągłego roz- 
kładu F, którego funkcja gęstości f oraz funkcja przeżycia F są następujące 


cosx s l — sinx TT 

em oii seh) 

fx) = 8%, Ry = 

Załóżmy, ze h(x) = tg(x) dla x € (—72/2,m/2). Oczywiście funkcja h spełnia założenia Le- 
matu |3.3]-- jest funkcją ściśle rosnącą, ciągłą i taką, że E|h(X,.,) | < s. Wówczas korzystając 


z równości (1.22) otrzymujemy funkcję regresji 


aj X 
E(x) =E (A(Xn:n) | Xun =x) = 5. “Alef dt = ee xE (-5, | , 


Zatem, w tym przykładzie h(a) =h(—q/2) = —©, natomiast €(—2/2) = 


Przykład 3.2. Rozważmy statystyki porządkowe X;-,, 1 < r < n, z rozkładu jednostajnego na 


przedziale (0, 1). Niech funkcja h: (0, 1) % R będzie następującej postaci 


h(x) =2--, x € (0,1). 
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Funkcja h spełnia założenia Lematu |3.3|oraz h(0) = lim,_,9+ A(x) = —œæ. Następnie korzystając 
ze wzoru (1.22) obliczamy funkcję regresji h(X,.,) względem X,_1:n 


logx 
lx 


E(x) =E (A(Xn:n) poz" =x) = pg |, Oroa =2+ XE (0,1). 


Zatem również € (0) = lim,_,9+ é (x) = — 


Uwaga 3.2. Zwykle h(a) > —%, a więc również ģ (œ) > —» i wtedy we wzorze można 
przyjąć xo = ©. Taka sytuacja ma miejsce we wszystkich następnych przykładach w tym roz- 
dziale. Poniżej sformułowane wyniki (Lemat Twierdzenie Lemat 3.6] oraz Twierdze- 
nie|3.3) zostaną udowodnione przy milczącym założeniu h(a) > —o. Są one jednak prawdziwe 
również, gdy h(œ) = —», ale przy zmianie œ na dowolnie ustalone xo € (@,B) w równia- 
nach (3.12), (3.23), oraz (3.34). Wymaga to odpowiednich oczywistych zmian w do- 
wodach. Zauważmy przy tym, że wybór xo nie wpływałby w tym przypadku na reprezentację 
charakteryzowanego rozkładu F (zob. np. Lemat|3.4). 


Następny lemat podaje jawny wzór na dystrybuante F w terminach funkcji 6 oraz h w przy- 
padku £ = 1 (por. [19], Twierdzenie 4.1). Dla k-tych wartości rekordowych (7,1 = k) odpo- 
wiednik tego wyniku otrzymali Grudzień i Szynal w pracy [33], natomiast dla statystyk porząd- 
kowych (%41 = n — r) Franco i Ruiz (por. [29], Twierdzenie 3.3). 


Lemat 3.4. Przy założeniach Lematul3.3] jeżeli znana jest funkcja regresji $ dana wzorem (3.2), 


to F jest jednoznacznie wyznaczona wzorem 


_ seep (fh), 
r=- (r [gma] ECA 


Dowód. Ustalmy dowolne xo € (œ, 8). Wzór możemy zapisać w następującej równoważ- 


nej postaci 
X 


E= EE) | [60)-K(O]dH(), xE (a,B), (3.7) 


xo 


gdzie H oznacza funkcję hazardową rozkładu F. Ze wzoru i Lematu otrzymujemy 


równość i a l 
Yr+1 Jxo ah = [ dH (t) = H(x) — H (xo). 


Skoro F jest dystrybuanta ciągłą, to F (œ) = 0, a więc H(a) = 0. Zatem kładąc xp > a@* otrzy- 


mujemy równość 


L BO oy 
al &(t) —h(t) =H), (3.8) 


z której możemy wyznaczyć jawny wzór na dystrybuante F. 


Uwaga 3.3. Zauważmy, że na mocy wzoru dla dowolnego rozkładu ciągłego F, dla któ- 
rego zachodzi równanie regresji mamy 


[oa x€ (a,B), (3.9) 
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oraz 


B O 
La o : (3.10) 


Ewe -f zz) =0. (3.11) 


Ostatni warunek otrzymujemy w analogiczny sposób jak dla rozkładów absolutnie ciągłych 


Ponadto 


z ciągłą funkcją gęstości (por. podrozdział[2. 1) wychodząc od równości (1.22). 
W dowodzie głównego twierdzenia w tym rozdziale pomocny będzie jeszcze jeden lemat 


będący uogólnieniem Lematu 


Lemat 3.5. Dla ustalonych liczb naturalnych r > 1, £ > 2, niech Y,...,y, będą dowolnymi 


parametrami oraz O < Ye < ri, 2 <i < £. Przypuśćmy, że 


(a) h,Ę: (a,B) R są funkcjami ściśle rosnącymi, ciągłymi i takimi, ze h(x) < &(x) dla 
x € (a,B), 


(b) T=(T%,.--,T_1) jest dowolnym rozwiązaniem układu £ — 1 równań catkowych 


(x)= Yr+i+1 BA) = q+1(£) x g = 
Tix) = ala) ef eat EO Elb) 1Sisl-1, 612 


gdzie T = h, spełniającym warunki 


h(x) ei) <... Ses xe(«,ß), (3.13) 
betes a <œ, x€(a,B), (3.14) 
es na = o0, (3.15) 
oraz 
ep jap (- pan Jenal +0) - 0. (3.16) 
Nec nto) = $4 hom 

AA * dn(t) 

G(x) xp (- |, PENI x € (a,B). (3.17) 


Wtedy G = 1 — G określa ciągłą dystrybuante taką, że dla uogólnionych statystyk porządkowych 


£ $ PE że 
AŻ AG ) z rozkładu G z parametrami Yy,..., Y+ zachodzi równość 


E(x) =E (a(t) BA = |; x€(a,B). 
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Dowód. Niech T = (q,...,T_1) będzie dowolnym rozwiązaniem układu równań całko- 
wych spełniającym warunki (3.13)--(3.16). Pokażemy najpierw, że funkcja G określona 
wzorem jest dystrybuantą pewnego ciągłego rozkładu. 

Z, uwagi na warunek funkcje podcałkowe w równaniach całkowych są dodat- 
nie. Skoro funkcja € jest z założenia Ściśle rosnąca, to dla dodatnich parametrów Y,+1,---, Yr+/ 
funkcje T;, 1 < i < @—1, są również ściśle rosnące na (a, B). Ponadto z ciągłości funkcji € oraz 
podstawowego twierdzenia rachunku całkowego otrzymujemy, że 7;, 1 < i < £— 1, są również 
funkcjami ciągłymi. 

Z monotoniczności i ciągłości funkcji 6, t, 1 <i < @—1, oraz warunku otrzymu- 
jemy natychmiast, że funkcja G jest również Ściśle rosnąca i ciągła na (a, B). Oczywiście 
lim;,_,q+ G(x) = 0. Aby wykazać, że lim, „g- G(x) = 1 skorzystamy z równoważnych postaci 
funkcji G. Na mocy Lematu B.IJi równań całkowych funkcja G określona wzorem 
może zostać przedstawiona również w następujących równoważnych postaciach 


G(x) = exp (- : [ onl) ji x€ (a,B), (3.18) 


Mitt Ja T(t) — T+1(t) 


dla 1 < i < &—1 oraz 


"HH _1 pt dę(t) 
G(r) = xp ( art han i" x€ (a,b). (3.19) 


— Tı (t) 


Biorąc teraz pod uwagę ostatnią równość i warunek (3.15) otrzymujemy, że gdy x > B”, to 


G(x) — 1, a zatem G jest dystrybuantą pewnego ciągłego rozkładu prawdopodobieństwa. 
Niech yO y» TEE yeo oznaczają uogólnione statystyki porządkowe z rozkładu G. 
Pokażemy teraz, że dla 0 < i < £—1 oraz x € (a, B) mamy 


tix) = E (tin MT") yE =x), (3.20) 


gdzie Ty = 6, T = h lub równoważnie 


- B - 
T(G) = Trip f T(G dG), xe (a, B). 


Zauważmy najpierw, że z (3.18) oraz (3.19) funkcja hazardowa rozkładu G może być przedsta- 


wiona następująco 


osl na L ang xe (a,b), (3.21) 


a G(t) Wad 16 Tilt) — Ti (t) 


dla 0 < i < £— 1. Wybierając teraz dowolny przedział [x,y] C (a, ß) otrzymujemy 


y z 
Mii f tal) aG) 


= —Y+i+1 [oo EGO ay + Vrti JĄ T(t)G(r) "41! dG(t) 


= | G(t)++1 dc;(t) — | Tilt) dG(t) +i 


x 


= Ti(x)G(x) "#1 — nly), 
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gdzie drugą równość otrzymujemy na mocy Lematu z (3.21), a ostatnią ze wzoru na całko- 
wanie przez części dla całki Riemanna-Stieltjesa. 
Postępując dalej jak w dowodzie Lematu 2.1]i stosując analogiczne argumenty jak w dowo- 
dzie Lematu|2.2]można wykazać, że dla 0 < i < £— 1 
lim t;(y)Gy) "+= =0. 


y>B" 


Tym samym prawdziwe są równości (3.20), a zatem na mocy Lematu[I.1|otrzymujemy żądaną 


tezę. 


Po tym wprowadzeniu podamy główny wynik tego rozdziału. 


Twierdzenie 3.1. Dla ustalonych liczb naturalnych r > 1 i £ > 2, niech x x9) będą uogól- 


nionymi statystykami porządkowymi z ciągłego rozkładu o dystrybuancie F: (a,B) + (0,1). 


Załóżmy, ze h: (a,B) + R jest funkcją ściśle rosnącą, ciągłą i taką, że Ejh(x(*" )| < ©, 


Wówczas regresja 


E(x) =E(h(x("") |x! =x), xelap) (3.22) 
określa rozkład prawdopodobieństwa jednoznacznie wtedy i tylko wtedy, gdy układ €— 1 równań 
całkowych 

yale) = yifaj+ Fe PHOT HHO gen, 1<i<E-1, G23) 
M+ Ja §(t)—yi(t) 
gdzie y, = h ma dokładnie jedno rozwiązanie Q = (Q1,..., Qr_1) spełniające warunki 
h(x) < pr_1(x) <...<pi(x)<$(x), xE(a,B), (3.24) 
SKO 
ss <w», x€(a,D), (3.25) 
l 50-00 ee 
Bo dé(t) 
Te EF, (3.26) 
jA Ś(t) — gilt) 
S dć (0 
x t 
lim ő(x)ex -f a y) =0. (3.27) 
„p. Se (— S grr 
Wówczas dystrybuantę F można wyrazić w postaci 
* _dn(t) 
F(x =1-exp(- f Z A): x€(a,B), (3.28) 
sao ag AAR 
gdzie funkcja n: («,B) — R jest określona wzorem 
4-1 a. 
nc 247 PO. (3.29) 
Yr+1 i=1 Yr+i+1 
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Dowód. Załóżmy, że dana jest regresja i oznaczmy Q, = h. Rozważmy funkcje Qj, 
0<i</—1, określone wzorami (1.19). Wówczas na mocy Wniosku[1. IJotrzymujemy = é. 
Ponadto, ponieważ każda funkcja Q; jest funkcją regresji kolejnych uogólnionych statystyk po- 
rządkowych, mianowicie regresją Q;+1 (per) wzgledem xy i) , to na mocy Lematu |1 ER 
otrzymujemy Qj+.| < Q; na (0,B),dla0 < i < £— 1. Zatem funkcje @; spełniają warunek (3.24). 
Co więcej, na mocy własności (3.9), oraz dla regresji kolejnych uogólnionych 


statystyk porządkowych, spełnione są analogiczne warunki (3.25), (3.26) oraz (3.27). 
Stosując teraz Lemat|3.3|do funkcji otrzymujemy 


66 = 9:0) + Yves | [60-000], USES OHI 
oraz ` dF 
20 =i +11 EO- FO 
Zapisując teraz funkcje Q;, 1 < i < £— 1 w postaci 
Mil Qi(t A t) dF (t) 
ph) = ala)" |, ey 0 60-00] pry” 


a następnie korzystając z Lematu (o zmianie funkcji całkującej) widzimy, że funkcje 
(1,---,Qe_1 spełniają układ równań całkowych (3.23). Zatem, jeśli € jest funkcją regre- 
sji daną wzorem (3.22), to układ ma co najmniej jedno rozwiązanie spełniające wa- 
runki (3.24)-(3.27). Ponadto dla funkcji r określonej przez (z 6 = Po) mamy 


* dn@) G1 f 1 
Le 0-807 By fe =H 
Ef, SD t)d F(t) 
i= > F(t) 


1 = dF (t) 
=. EG) =h(r) w ) — Pit i) FG) 
dF 


gdzie drugą równość dostajemy korzystając ponownie z Lematu a ostatnia wynika z wła- 
sności lim,_,q+ H(x) = 0. Ostatnia równość wprost implikuje wzór (3.28). 

Z drugiej strony, na mocy Lematu każde rozwiązanie układu spełniające wa- 
runki (3.24)—(3.27) określa pewien rozkład prawdopodobieństwa, dla którego zachodzi równość 
regresji (3.22). Jeśli zatem istnieje dokładnie jedno takie rozwiązanie, to musi ono pokrywać 


się z @ = (Qi,...,Pr_1) określonym przez (1.19). Zatem F jest wyznaczona jednoznacznie. 


W przeciwnym razie istnieją co najmniej dwa różne rozkłady, dla których zachodzi (3.22). 


Wniosek 3.1. Ustalmy r € N i niech xt ) x! rel 


wymi z ciągłego rozkładu F określonego na przedziale (a,B). Załóżmy, że h: (a,B) > R 


będą uogólnionymi statystykami porządko- 
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r+2 


jest funkcją Ściśle rosnącą, ciągłą i taką, ze E|h(x! | < co, Wówczas funkcja regresji 


é: (œ, B) — R określona wzorem 


E(x) =E (h (2777) | xl = x) (3.30) 


jednoznacznie charakteryzuje rozkład zadany ciągłą dystrybuantą F wtedy i tylko wtedy, gdy 


równanie całkowe 


sa Yr+2 x y(t) — h(t) 
6 = y(a) + Fe |, DEO dé (t) (3.31) 


ma dokładnie jedno rozwiązanie y = @(x) spełniające warunki 


(i) h(x) < p(x) <6(x) dla x € (a, B), 


o FOKO tas 
E ow < dla x € (a, B), 


... [B  d&(t) 2 
Gi) 50-007 
d( 


SĄ ARP (- oe 5) = 


Wówczas dystrybuantę F można wyznaczyć ze wzoru 


z * dn(t) 
F(x) = 1 — exp (-[ pr , x€(a,B), (3.32) 
gdzie n(x) = $2 + SE. 


Uwaga 3.4. Jeżeli dodatkowo założymy, że funkcja regresji 6 jest różniczkowalna, to z układu 
równań całkowych (3.23) otrzymujemy układ / — 1 równań różniczkowych 
r M+i+1 Vi Vit gr ; 
y= é (x), I1<i<£-l, 
Yr+1 a (x) YI 


a z warunków (3.24)—(3.27) otrzymamy warunki (2.29)-(2.32). Zatem Twierdzenie [3.1] jest 
uogólnieniem Twierdzenia 


Podsumowując, w niniejszym podrozdziale uogólniliśmy główne wyniki rozdziału [2] Poda- 
liśmy kryterium jednoznacznej charakteryzacji rozkładów ciągłych w terminach równań całko- 
wych. W kolejnym podrozdziale zajmiemy się zastosowaniem tego kryterium w szczególnych 


przypadkach. 


3.2 Jednoznacznos¢ charakteryzacji — szczególne przypadki 
dla l = 2 


W zastosowaniach Twierdzenia[3. I|napotykamy na podobne trudności jak w przypadku kry- 


terium jednoznaczności charakteryzacji wyrażonego w terminach równań różniczkowych (patrz 
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podrozdziat|2.2). Równania całkowe, które otrzymaliśmy są nieliniowe ze względu na nieznaną 
funkcję, co więcej rozwiązanie układu równań całkowych musi spełniać nieklasyczne 
warunki ograniczające (3.24)-(3.27). 

W niniejszym podrozdziale zajmiemy się zagadnieniem jednoznaczności charakteryzacji 
ciągłych rozkładów prawdopodobieństwa przez regresje uogólnionych statystyk porządkowych 


o odstępie £ = 2. Rozważymy problem dla dwóch szczególnych przypadków: 
(i) h jest funkcją ograniczoną z góry, a więc h(B) < ©; 


(ii) h jest funkcją nieograniczoną (h(B) = œ) oraz regresja € jest funkcją asymptotycznie 


liniową względem h, mianowicie 


lim [6 (x) — (ah(x) +b)| =0, (333) 


x B- 


dla pewnych współczynników a > 1,b € R. 


3.2.1 Własności rozwiązań pomocniczego problemu całkowego 


W niniejszym paragrafie przeanalizujemy własności rozwiązań następującego problemu 


całkowego 
vex) = ya) +7 [LOM aś) 
a 5(6)-5() x € (a, B), (3.34) 
h(x) < y(x) < (x), 
gdzie y > 0 oraz 6, h są funkcjami ściśle rosnącymi i ciągłymi. Zatem, biorąc pod uwagę wa- 
runek h < y < 6, otrzymujemy, że funkcja podcałkowa w powyższym równaniu całkowym jest 


dodatnia. Stąd każde rozwiązanie powyższego problemu jest również funkcją ściśle rosnącą. 


Lemat 3.6. Niech h,§: (a,B) R będą funkcjami Ściśle rosnącymi, ciągłymi i takimi, że 


h< & na przedziale (a, B). Załóżmy, że y > O oraz g,y: (a,B) + R są dwoma różnymi roz- 
wiązaniami problemu catkowego (3.34). Wtedy 


(i) y(x) £ Q(x) w każdym punkcie x € (a, B); 


(ii) albo y < 9, albo y > Q na całym przedziale (a, B); 


(iii) jeżeli z = |y— Q|, to z jest funkcją Ściśle rosnącą na (a,B); 


(iv) jeżeli y < p i w = £=, to w(a) <w < 1 oraz w jest funkcją ściśle rosnącą na (a,B); 
ę ph 
(v) jeżeli y > Q, w = z £ i dodatkowo Y > 1, to w(@œ) < w < 1 oraz w jest funkcją ściśle 
p Eo Y 


rosnącą na (a, B). 


60 


Uwaga 3.5. Dla skrócenia zapisu będziemy pisać f% fdg zamiast f% f(t) dg(t), jeżeli tylko nie 
będzie prowadzić to do niejednoznaczności. 

Dowód. (i) Dla dowolnie ustalonego x9 € (a,B) oznaczmy @ = (xo). Niech 
D=4(x,y): xe (a,B), h(x) <y<$5(x)). Wybierzmy € > 0 tak małe, aby kula 
B = B((x0,9o),£) C D. Rozważmy funkcję K: D — (0,%) określoną wzorem 

y—h(x) 

E(x) -y 


a więc równanie całkowe w (3.34) można przedstawić w postaci 


K(x,y) = 


6) =y(a) +7 f KENDE. (3.35) 
Wówczas dla wszystkich y;,y2 takich, ze y1 Æ y2, (x,y1) € B oraz (x,y) € B mamy 


E(x) — h(x) E 
Ete — yi Ele) ayy) P11 


Stąd funkcja K spełnia warunek Lipschitza ze względu na y w otoczeniu B punktu (xo, Qo). 


|K(x,91) —K(x,)2)| = 


Zatem korzystając z klasycznych metod możemy twierdzić, że równanie całkowe Z Wa- 
runkiem początkowym y(x0) = @p ma jednoznaczne rozwiązanie w przedziale (xo — 6,x9 + ô) 
dla pewnego 6 > 0 wystarczająco małego. Tak więc, jeżeli y jest innym rozwiązaniem równa- 
nia (3.34), to y(x0) £ p(x0). To kończy dowód punktu (i). 

(ii) Wystarczy zauważyć, że rozwiązania @ oraz y są ciągłe. Skoro ich różnica jest zawsze 
różna od zera, to albo jest dodatnia, albo ujemna na całym przedziale (a, B). 


(iii) Najpierw zauważmy, że jeśli y i @ są rozwiązaniami problemu całkowego (3.34), to 


6-96) =a) — pla)-+y | FH ag, (3.36) 


Załóżmy, że y > g i rozważmy z = y— g. Ponieważ ¢& jest funkcją ściśle rosnącą, a funkcja 
podcałkowa w (3.36) jest dodatnia na (œ, B), to również z jest funkcją ściśle rosnącą na (a, B). 
Jeżeli y < @, to wystarczy przyjąć z = f = > aby wykazać żądaną tezę. 


(iv) Niechh<y<@< 6 oraz w = = =. Kładąc f=p-—yig=9— h w Lemacie|3.2] dla 


dowolnego x € (a,B) uzyskujemy 


w(a)—w(a) = | ——-a-y)- [ 2 a(o—n. (8.37) 


Pierwsza całka w równaniu (3.37) jest równa 


= al (¢ —h)(9—y) 
Lge =1f GENE GF 
E-h) 
Th 


(3.38) 


j 
= (6-M(p-y) 

= | Gorey 
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gdzie pierwsza równość wynika z równości (3.36) zastosowanej do p — y, a druga równość 
wynika z Lematuf3.1] Wstawiając teraz (3.38) do (3.37) uzyskujemy 


weis lia A b Lagt | 2, 


Z założenia h < y < g obie funkcje podcałkowe w ostatnim wyrażeniu są dodatnie. Zatem w jest 


funkcją Ściśle rosnącą, gdyż p i h są ściśle rosnące na (a,B). 
(v) Jeżeli h < p < y < &, to podobne rozumowanie przeprowadzone dla funkcji w = = 


prowadzi do wniosku, że 


_ [329 
«5-9 
gdzie w(t) = y(t) +(y—1)&(t) + g(t). Ponieważ y> 1 oraz €, y, p są funkcjami rosnącymi, to y 


w(x) -w(a) = dy, (3.39) 


jest funkcją rosnącą. Z założenia p < y < € wynika, ze funkcja podcatkowa w równaniu (3.39) 


jest dodatnia. Zatem możemy wnioskować, że w jest funkcją Ściśle rosnącą. 


3.2.2  Jednoznaczność charakteryzacji dla h(B) < © 


Następne twierdzenie orzeka o jednoznaczności charakteryzacji ciągłych rozkładów praw- 
dopodobieństwa przez regresje uogólnionych statystyk porządkowych (1.11) w przypadku, gdy 
L =2oraz h jest funkcją ograniczoną z góry, tak więc h(B) < ©. 


r+2) 


Twierdzenie 3.2. Dla ustalonego r € N, niech xt ) x! ( będą uogólnionymi statystykami 


porządkowymi z rozkładu określonego przez ciągłą dystrybuantę F. Załóżmy, że h: (a,B) R 


jest funkcją ściśle rosnącą, ciągłą i taką, że h(B) < œ oraz E kx? 


)| < œ, Jeżeli znamy 
regresję 


E(x)=E (h (x+?) | x = x) | 


to F jest jednoznacznie wyznaczona wzorem (3.32). 


Powyższe twierdzenie jest uogólnieniem Twierdzenia na przypadek funkcji regresji, 
które nie są różniczkowalne w każdym punkcie. Jego dowód jest powtórzeniem tego samego 
rozumowania co w dowodzie Twierdzenia [2.3]z wykorzystaniem własności rozwiązań pomoc- 
niczego problemu całkowego udowodnionych w Lemacie 3.6] 

Spodziewamy się, że twierdzenie to jest również prawdziwe w przypadku dowolnego / > 2. 
Jednakże chcąc wykazać jednoznaczność rozwiązania układu równań całkowych napo- 


tykamy podobne trudności jak omówione w Uwadzef2.5] 


3.2.3  Jednoznaczność charakteryzacji dla h(B ) = » 


W przypadku, gdy h(B) = œ nie jest tak łatwo wykazać jednoznaczność rozwiązania pro- 


blemu (3.34), a co za tym idzie jednoznaczność charakteryzacji rozkładu prawdopodobieństwa 
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przez regresję €. Poniżej wykazemy, że analogiczny wynik jak w Twierdzeniu [3.2|zachodzi dla 
h(B) = » przy założeniu, że funkcja regresji uogólnionych statystyk porządkowych 6 jest funk- 
cją asymptotycznie liniową względem A, ściśle mówiąc zachodzi warunek (3.33). Oczywiście 
w takim przypadku na mocy założenia 5 > h mamy a > 1 oraz jeżeli a = 1, to b > 0. Ponadto, 
z rozważań na początku podrozdziału [2.2.3] wynika, że dla a = 1 możemy założyć, że b > 0 
(por. warunek (2.42)). Rozpoczniemy od następującego lematu. 


Lemat 3.7. Załóżmy, że €,®: (a,B) > R są funkcjami ciągłymi i & jest funkcją ściśle rosnącą 


taką, że lim,_,g- § (x) = ©. Zdefiniujmy funkcję g: (a, B) + R wzorem 


s(x) =s(a)+ | HW) 4E (0), 


Jeżeli lim,_,g- P(x) =A € (0,%], to lim,_„g- ia ae 


Dowód. Niech £x, |„>1 będzie dowolnym rosnącym ciągiem liczb z przedziału (a, B) takim, ze 
imp X, = B. Wtedy dla n > 1 uzyskujemy 
Xn+1 
slsns1)— en) = f Eal) 


Z twierdzenia o wartości średniej dla całki Riemanna-Stieltjesa wynika, ze dla każdego n > 1 


istnieje punkt 6, € (Xn, Xn+1) taki, że 


8(Xn+1) = 8(Xn) 
e 2 


Oczywiście 0, — B, gdy n — œ, tak więc z przyjętego założenia dla funkcji © otrzymujemy, 


że P(6,) A, gdy n  ». Z klasycznego twierdzenia Stolza wynika, że 


lim SCW) _ 4, 


n> © (Xn) 


co kończy dowód lematu. 


Twierdzenie 3.3. Niech h,&: (a, B) > R bedą Ściśle rosnącymi, ciągłymi funkcjami takimi, że 
h < 6, h(B) = » oraz é spełnia warunek (3.33) dla pewnych a > 1, b € R. Załóżmy, ze y> 1 
oraz problem całkowy (3.34) ma rozwiązanie © takie, ze 


lim [@(x) — (ch(x) +d)| =0, (3.40) 


dla pewnychc> 1,d ER. 


(a) Jeżeli a = 1, to c = 1, d = = > 0, a ponadto © jest jedynym rozwiązaniem problemu 
całkowego (3.34). 
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(b) Jeżeli a > 1, to c jest wyznaczone jako jedyne rozwiązanie równania kwadratowego 
2 — 
c +a(y-1l)chay=0 (3.41) 
w przedziale (1,a), a ponadto Q jest jedynym rozwiązaniem problemu całkowego (3.34). 


Dowód. (a) Z warunku h < p < 6, dla dostatecznie dużych x, dostajemy 


P(x) _ S(x) 


P(x. 


Zatem, jeżeli a = 1, to oczywiście c = 1. Z równości ( 3.33) i (3.40) dostajemy lim,_„g- Aa 
oraz lim,_,g- [§ (x) — @(x)] =b—d > 0. Kładąc 


LSL 


ij = 22) (3.42) 
mamy P(x) > gi gdy x > B~ oraz 


etx) —e(a) =r | S0C) 
Stosując teraz Lemat]3.7|otrzymujemy 


im 2%) = y 40 
x+B- 6(x) b-—d 


Z drugiej strony wiemy, że granica ta jest równa 1, zatem 


d 
1 = y—— A 
YI (3.43) 


Stąd d = 77, jest liczbą dodatnią. 
Załóżmy teraz, że y jest innym rozwiązaniem problemu (3.34) spełniającym warunek 


h <y<6. Wtedy dla dostatecznie dużych x mamy 


y(x) _ (x) 


y(x) 


a zatem również lim,_,g- ig — 1 oraz lim, g- = J= = 1. Z Lematu B.ói wiemy, że albo 


y< g, albo p < y. Jeżeli p < y < 6, to rozważmy funkcję pomocniczą z = y— @. Z Le- 
matu B.6fiii) funkcja z rośnie od z(@) > 0 do dodatniej stałej C € (z(a),b — d]. Załóżmy naj- 
pierw, że C < b — d. Definiując 


—h 
= R (3.44) 
E- ọ-z 
a następnie przechodząc do granicy, gdy x + B~ dostajemy ¥(x) > > 54. Stosując ponownie 


Lemat]3.7]|do całki ; 
6) -x(a) = r | HAE) 
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oraz uwzględniając fakt, że e a 1, gdy x > B~ otrzymujemy 
5 (x) 


pay O44 
b-d-—C 
Porównując powyższą równość z (3.43) dostajemy C = 0, co daje sprzeczność. Gdyby nato- 
miast C = b — d, to V(x) > », m x>B.Z Lematu|3.7|otrzymamy Ww — œ, CO przeczy 
temu, że y < 6 na (a, B). 
Jeżeli h < y < g, to wystarczy rozważyć funkcję z = p — y, aby dojść do kolejnej sprzecz- 
ności. Zatem funkcja @ jest jedynym rozwiązaniem problemu (3.34). 
(b) Ogólna idea dowodu dla a > 1 jest taka sama jak dla a = 1. Poniżej przedstawiamy szkic 
tego dowodu. Zauważmy, że lim,_„g- i = = a oraz lim,_,g- A = = c. Stąd 
x) c 
mi pa = (3.45) 
Oczywiście 1 < c < a. Pokażemy najpierw, że c € (1,a). Przedstawmy funkcję ® określoną 


przez w następującej postaci 


oe] 
OW) = 0 26 
h(x)  h(x) 


Jeśli c = 1, to lim, „g- P(x) = 0, a gdyby c = a, to lim, „g- ka = co, W obu przypadkach, 
na mocy Lematu [3.7 A RSD do sprzeczności z równością (3.45). Zatem c € (1,a) i gdy 
x — B-, to P(x) > <1 Korzystając po raz kolejny z Lena ]usjen gz ! > y=, co 
w zestawieniu z E (3.45) prowadzi do równania kwadratowego (3.41). Zauważmy, 
że równanie to ma dwa pierwiastki różnych znaków i oznaczmy jego lewą stronę przez f(c). 
Ponieważ a > 1, to f(1) = 1—a < 0 oraz f(a) =ay(a— 1) > 0. Zatem równanie ma 
dokładnie jedno rozwiązanie w przedziale (1,a). 

Załóżmy teraz, że y jest innym rozwiązaniem problemu oraz, że istnieje M 


lim,_,g- a }. Oznaczmy te granice przez L(y ). Wówczas ponownie korzystając z Lematu 


LD) — L(y)— 


=y Ale to równanie określa jednoznacznie c, zatem 
a— T5 


dostajemy, że L(y) € (1,a) oraz 
L(y) = c dla dowolnego y siamese warunek (3.34). 

Dla przypadku @ < y < 6 rozwazmy funkcję w = Ev Z, Lematu B.ófv) funkcja w rośnie od 
w(a) >O0doC e (w(a), 1]. Zauważmy, że W określona przez może zostać przedstawiona 


w postaci 


= 1-59 "1l=w 


c 


ya 


1-C ' 


Załóżmy najpierw, że C < 1. Wtedy granica funkcji H w punkcie B istnieje i jest równa 
Z drugiej strony 


ye) =la) +7 | POE 
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CHE 
zatem korzystając z Lematu|3.7|otrzymujemy istnienie granicy lim, g- a = Ye. Z przed- 


stawienia = p= =}. E otrzymujemy istnienie granicy lim, g- e e co implikuje 


p „RE 
a T 


Ale powyższa równość zachodzi tylko dla C = 0, co daje sprzeczność. Gdyby natomiast C = 1, 
to H(x)  ». Wówczas na mocy Lematu B.7|otrzymamy a 3 — œ, gdy x + B~. To przeczy 
temu, że y < 6 na (œ, ß). Stąd dla przypadku @ < y, wykazaliśmy, że @ jest jedynym rozwią- 
zaniem problemu (3.34). 


Dla przypadku h < y < g wystarczy przeprowadzić analogiczne rozważania wykorzystując 


— PY 
m ph" 


własności funkcji aby dojść do kolejnej sprzeczności. 


Uwaga 3.6. Zaznaczmy, że warunek y > | jest wymagany tylko w dowodzie punktu (b) po- 


Hae) 


wyższego twierdzenia. W kolejnym podrozdziale będziemy stosować to twierdzenie z y= wai 


Zgodnie z Uwaga|I.2|nie zmniejsza to ogólności rozważań. 


Z Twierdzeń [3.1] i [3.3| otrzymujemy jednoznaczną charakteryzację rozkładu prawdopodo- 
bieństwa przez asymptotycznie liniowe regresje uogólnionych statystyk porządkowych o odstę- 


pie l =2. 


x” ) x! (r+2) 


Twierdzenie 3.4. Dla ustalonego r € N, niech będą uogólnionymi statystykami po- 


rządkowymi z rozkładu określonego przez ciągłą dystrybuantę F. Załóżmy, że h: (a,B) > R 


jest funkcją ściśle rosnącą, ciągłą i taką, że EJh(x(*7)| < » oraz h(B) = ». Jeżeli regre- 


sja 6 określona wzorem (3.30) spełnia warunek (3.33) dla pewnych a > 1, b € R oraz problem 
całkowy (3.34) ma rozwiązanie 9, które spełnia warunek (3.40), to funkcja regresji & jedno- 


znacznie wyznacza ciągły rozkład prawdopodobieństwa, którego dystrybuanta F dana jest wzo- 


rem (3.32). 


3.3 Przykłady nowych charakteryzacji rozkładów ciągłych 


W niniejszym podrozdziale podamy nowe charakteryzacje ciągłych rozkładów przez po- 
jedynczą funkcję regresji wartości rekordowych o odstępie dwa (¢ = 2). Jako narzędzi do ich 
otrzymania użyjemy wyników z poprzednich podrozdziałów. 

Podobnie jak w podrozdziale|2.3] dla uproszczenia zakładać będziemy, że h(x) = x (por. Le- 
mat|1.4) oraz rozważać będziemy przypadek wartości rekordowych. Zatem, dla ustalonego na- 


turalnego r > 1, rozważamy następującą funkcję regresji 


E(x) = E (R,42 |R, = x). 
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Wychodząc od równania (1.22) dla 7,41 = 1 otrzymujemy następującą postać regresji kolejnych 


wartości rekordowych 


E(x) = E (R2 | R1 =x) = Fo) [ rar. (3.46) 


Stosując Wniosek[1.I]dla / = 2 dostajemy 
1 co 
E(x) = E(p(R,) | Rr =x) = ral lt) dF (t). (3.47) 


Odpowiedniki tych wzorów dla różniczkowalnych funkcji stanowiły podstawę obliczeń w pod- 
rozdziale |[2.3|(por. wzory i (2.46). 

W pierwszym przykładzie pokażemy, że dla rozkładu z ciągłą dystrybuantą F i nieciągłą 
funkcją gęstości f, funkcja regresji 6 w niektórych punktach nie musi być różniczkowalna, ale 


zachodzi jednoznaczność charakteryzacji. 


Przykład 3.3. Rozważmy rozkład, którego funkcją gęstości jest określona wzorem (3.1) a od- 
powiadająca jej dystrybuanta jest równa 
3; dla x € [0, 1), 


F(x) = (3.48) 
aot dlax € [1,2]. 


Korzystając ze wzoru (3.46) 1 wykonując elementarne obliczenia otrzymujemy 


x— 
sans dla x € (0,1), 


X41, dlaxé [1,2]. 


p(x) = 


Nastepnie ze wzoru (3.47) dostajemy 


7-3) (x? + 6x —21+4log (35%)), dlax € [0,1), 


5 (x) = (3.49) 


46 dla x € [1,2]. 
Zauważmy, że funkcja 6 jest ciągła na całym przedziale x € (0,2), ale nie jest różniczkowalna 
w punkcie x = 1. W przykładzie tym mamy B = 2, co implikuje h(B) = 6(B) < ». Zatem 
jednoznaczność charakteryzacji ciągłego rozkładu przez funkcję regresji wynika 
wprost z Twierdzenia 3.2] Jednakże z uwagi na nieciągłość funkcji gęstości, jednoznaczność ta 


nie może być wywnioskowana z Twierdzenia 2.3] 


W kolejnym przykładzie podamy nową charakteryzację pewnego rozkładu gamma przez 
regresję wartości rekordowych. Przypomnijmy, że rozkład Gamma(k, 0) z parametrami k, 6 > 0 


ma funkcję gęstości daną wzorem 


gdzie I oznacza funkcje gamma Eulera. 
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Przykład 3.4. Rozważmy rozkład Gamma(2, 1), którego funkcja gęstości i funkcja przeżycia 
są następujące f(x) = xexp(—x), F(x) = (1+x)exp(—x) dla x > 0. Wprowadźmy funkcję po- 


mocniczą 


E(x) = expt) | POJ dt, x>0. 


Wykonując elementarne obliczenia otrzymujemy równości 
1 1 
E' (x)= (1 — 3 E(x) > 


oraz lim,_,„E(x) = lim,_,.. EF’ (x) = 0. 


Wychodząc teraz od równości (3.46) dostajemy g(x) = x + 1 + a następnie ze 


= d 
wzoru (3.47) mamy 


2 
= 2+ —— -E 1 , 
E(x) =x+ Fe (+1), x>0 


Teraz chcemy wykazać, że powyższa funkcja regresji charakteryzuje rozkład Gamma(2, 1) 
jednoznacznie. Ponieważ h(B) = ©, to nie możemy jak w p przykładzie zastosować 


Twierdzenia B.2] 3.2] Można łatwo sprawdzić, ze p(x) =x+1+ -+ — jest rozwiązaniem problemu 


6'(x) (3.50) 
takim, że x < @(x) < $(x) dla x > 0. Ponadto 


lim [é (x) — (:+2)]=0, lim[@(x) - (x+1)|=0. 


X—>00 X—>00 


Zatem na mocy Twierdzenia B.3fa) dostajemy, że @ jest jedynym rozwiązaniem pro- 
blemu (3.50). Ostatecznie z Twierdzenia otrzymujemy, że rozkład Gamma(2, 1) jest je- 
dynym rozkładem, dla którego spełniony jest warunek 

E(R,42 | Ry =x) =x+2+ 7 E(t 1), x>0. 

W następnym przykładzie uogólnimy wnioski z Przykładu Pokażemy, że każdy roz- 
kład Gamma(k, 0) jest jednoznacznie określony przez odpowiadającą mu regresję uogólnio- 
nych statystyk porządkowych &(x) = E (x077 | x)= x). Jednakże, w przeciwieństwie do 
poprzedniego przykładu, z uwagi na skomplikowane obliczenia, nie podajemy jawnych postaci 
funkcji € oraz g(x) = E(x$*) | xa x). 


Przykład 3.5. Przypomnijmy, że dla dystrybuanty F z gęstością f 


Mx) = gry; x€ (OB) 


oznacza intensywność awarii rozkładu F. Dla rozkładu Gamma(k, 0) można łatwo sprawdzić, 
ze dla dowolnego k > 0 mamy 


lim A (x) = 


X—>00 
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Przeprowadzając dalej rozumowanie jak w dowodzie Lematu2.4|dostajemy, że 


1 1 1 
lim |p(x) —x| = lim a 
PODA A Oya 


oraz podobnie 


tim [£09- = ( +22) lim = ( + | | 

"w + Wea) A(x) ONY wa 

Zatem dla dowolnego rozkładu gamma odpowiadające mu regresje uogólnionych statystyk po- 
rządkowych 6 oraz @ spełniają odpowiednio warunki oraz za=c=l.Cowięcej, 
z dowodu Twierdzenia B.I|wiemy, że Q jest rozwiązaniem problemu (3.34). Z Twierdzenia B.4] 
dostajemy, że jest to jedyne rozwiązanie problemu (3.34), a zatem rozkład Gamma(k, 0) jest 


jednoznacznie charakteryzowany przez odpowiadającą mu funkcję regresji 6. 


Uwaga 3.7. Podobna sytuacja jak w Przykładzie B.5|dla rozkładu gamma ma miejsce również 
dla innych rozkładów. Poniżej podamy kilka dobrze znanych rozkładów, dla których funkcja 
intensywności awarii ma skończoną dodatnią granicę. Zatem w analogiczny sposób jak w Przy- 
kładzie |3.5]możemy wykazać jednoznaczność charakteryzacji tych rozkładów przez odpowia- 


dające im regresje 6. 


e Rozkład wykładniczy ze stałą funkcją intensywności awarii A(x) = 0. Jest on szcze- 
gólnym przypadkiem rozkładu gamma z parametrem k = 1, jak również szczególnym 
przypadkiem rozkładu Weibulla z parametrem ô = 1 (por. wzór (2.48)). 


e Rozkład Gumbela z parametrami 0 > 0, u € R określony przez 


f(x) = 0G(x)exp[-G(x)], Fi) =1-exp|-G(X], xER, 
gdzie G(x) = exp |—0(x — u)|, dla którego 


ai oraz limA(x)=0. 


MO) = aple] oe 


e Rozkład logistyczny z parametrami 0 > 0, u € R określony przez 
G = G 
ÓW z F(x)= 0... , xe 
[1+ G(x) 1+ G(x) 
gdzie funkcja G jest określona jak w poprzednim punkcie, dla którego 
0 


A(x) = IG) oraz lim 2 (x) =0. 


f(x) = 6 


A 


Z drugiej strony dla wielu rozkładów prawdopodobieństwa mamy lim,_,..A(x) = 0, a więc 
liMy_0 [6 (X) — x] = ». Tak jest m.in. dla rozkładu Weibulla z 6 < 1, Pareto czy rozkładu 
logarytmiczno-normalnego. W ogólności, pytanie o charakteryzacje tych rozkładów przez re- 


gresje uogólnionych statystyk porządkowych pozostaje otwarte. 
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Zauważmy, że w Przykładach [3.4]|i 3.5] funkcje regresji uogólnionych statystyk porządko- 
wych spełniały warunek asymptotycznej liniowości (3.33) z parametrem a = 1. W kolejnym 
przykładzie rozważymy rozkład prawdopodobieństwa, dla którego w warunku (3.33) mamy 


współczynnik a > 1. 


Przykład 3.6. Oznaczmy D(x) = x? +2x+ 2 i rozważmy rozkład określony następującą funkcją 
gęstości f(x) = 2v2(1 +4x+ 2x2)D(x)72 dla x > 0. Funkcja przeżycia F dana jest wzorem 
F(x) = 2V2(1+x)D(x)72 dla x > 0. 
Ponownie ze wzorów (3.46) i (3.47) wyznaczamy regresje 
1 
=a 
Q(x) =2x+1+ a 


oraz 


1+x 


o x + 5x? log] "> 
E(x) (so + 5x* + D(x)? log EWO 


ES] 


) ; (3.51) 


Elementarne, ale żmudne obliczenia pokazują, że lim, _„»[ć (x) — (4x + 3)| = 0 oraz 
limy—.0[@(x) — (2x + 1)] = 0. Zatem na mocy Twierdzenia |3.4| otrzymujemy, że F jest jedy- 
nym rozkładem, dla którego zachodzi tożsamość (3.51). 


W ostatnim przykładzie pokażemy, że w ogólnym przypadku regresja € nie musi być 
asymptotyczne liniowa względem h, a zatem problem jednoznacznej charakteryzacji rozkła- 
dów przez dowolną funkcję (3.30) pozostaje otwarty. 


Przykład 3.7. Rozważmy rozkład prawdopodobieństwa określony przed dystrybuantę F daną 
wzorem 


e 
w , > e, 
x(logx)!+4 aie 


gdzie a > 0. W tym przypadku, korzystając z wyniku Nagaraja otrzymujemy, że E(R,) < œ% 


F(x)=1 


wtedy i tylko wtedy, gdy n < a+ 1. Stąd E(R3) < ©, o ile a > 2. Zatem dla h(x) = x otrzymu- 


jemy kolejno 
1 
E(x) =E (R3 |R: =x) =x (1 + Tiogx) 
a 


oraz 


E(x) = E (R; | Ri =x) =x (14S bogs} p (logs). 


Można sprawdzić, ze @ jest rozwiązaniem problemu (3.34) takim, że x < @(x) < é (x) dla x > e, 
ale nie mamy podstaw aby twierdzić, że jest to jedyne rozwiązanie tego problemu. W tym 
przykładzie € nie spełnia warunku (3.33), zatem nie możemy zastosować Twierdzenia 3.4] aby 


wykazać, że powyższa funkcja regresji charakteryzuje rozkład F jednoznacznie. 


Na koniec tego podrozdziału podamy jeszcze jedno zastosowanie wyników z podroz- 


działu 
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Uwaga 3.8. Wiemy, że w przypadku gdy regresja € jest liniowa (2.49), to problem różnicz- 
kowy ma rozwiązanie liniowe (2.54). Zamieniając problem na odpowiadający 
problem całkowy widzimy, że spełnione są założenia Twierdzenia [3.4] Stąd 6 jednoznacznie 
wyznacza rozkład prawdopodobieństwa, którego dystrybuanta F dana jest wzorem (3.32). Po- 
wyższe rozumowanie stanowi kolejny dowód jednoznacznej charakteryzacji rozkładów praw- 


dopodobieństwa przez liniową regresję uogólnionych statystyk porządkowych o odstępie dwa. 
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Rozdział 4 


Charakteryzacje dyskretnych rozkładów 
prawdopodobieństwa przez regresje 


słabych wartości rekordowych 


W niniejszym rozdziale rozważać będziemy problem charakteryzacji dyskretnych rozkła- 
dów prawdopodobieństwa przez regresje słabych wartości rekordowych. Skupimy się głównie 
na regresji słabych wartości rekordowych, gdyż jak wiemy są one poprawnie określone również 
dla ciągów zmiennych losowych o skończonych nośnikach. Jak już wyjaśniliśmy w podroz- 
dziale|1.3|jest to również spowodowane faktem, że uogólnione statystyki porządkowe z rozkła- 
dów dyskretnych nie mają własności Markowa. 

Na początku tego rozdziału przyjrzymy się wybranym funkcjom, które charakteryzują dys- 
kretne rozkłady prawdopodobieństwa. Następnie podamy warunek konieczny i dostateczny dla 
jednoznacznej charakteryzacji dyskretnego rozkładu prawdopodobieństwa przez regresje sła- 
bych rekordów określonych wzorem (1.13), co stanowi główny wynik tego rozdziału. W ko- 
lejnych podrozdziałach zastosujemy uzyskane wyniki do otrzymania nowych charakteryzacji 
rozkładów dyskretnych, jak i wyprowadzenia znanych charakteryzacji przy użyciu nowego po- 
dejścia przedstawionego w niniejszym rozdziale. W ostatnim podrozdziale odniesiemy się do 
problemu charakteryzacji rozkładów przez regresje dyskretnych rekordów, które jak wiemy 
charakteryzują wyłącznie ogony rozkładów o nieskończonym nośniku. 

W dalszym ciągu (por. podrozdział 1.4.2) zakładamy, ze (X,, n > 1} jest ciągiem niezalez- 
nych zmiennych losowych o jednakowym dyskretnym rozkładzie określonym przez niezdege- 
nerowaną dystrybuantę F o nośniku S = {0,1,...,N}, gdzie N < o, Ponadto dla N < © przyj- 
mujemy § = S \ {N}, a dla N = œ przyjmujemy konwencję S = S oraz N — k = œ, k = 0,1,.... 

Niech p = P(X, = k) oraz q; = P(X, > k) = ae pj dla k € S określa rozkład prawdopo- 


dobieństwa dyskretnej zmiennej losowej o wartościach w zbiorze S. 
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4.1 Uwagi wstępne 


W tym podrozdziale przedstawimy wybrane funkcje charakteryzujące dyskretne rozkłady 
prawdopodobieństwa. Funkcje te i ich własności będą wykorzystywane w następnych podroz- 
działach. 


Niech F = 1 —F oznacza funkcję przeżycia rozkładu F 
F(k)=1—F(k)=P(X>k), kes. 


Wówczas po = 1 — F (0), pp =F(n—1)-F(n), dlan=1,2,...,N. Ponadto F(n) = qn+1. Oczy- 
wiście, gdy N < oo, to F (n) = 0 dla n > N. Dlatego, w dalszym ciągu nie będziemy szczegółowo 
specyfikować F w tym przypadku. 
Rozważmy następnie funkcję intensywności awarii rozkładu F określoną wzorem 
i= RES. 
dk 
Stąd dostajemy 


n—1 


Po=A(0), pa=A(n)[[U-Alk)), n=1,2,...,N. (4.1) 
k=0 


Co wiecej, funkcja F jest jednoznacznie wyznaczona przez funkcje A wzorem 


n 


F(n)=[[1-2A()), nes. (4.2) 


k=0 
Zauważmy, ze w przypadku, gdy N < œ mamy py = qy, zatem A(N) = 1 i F(N) =0. 
Dalej będziemy używać również funkcji zdefiniowanej następująco 


Hoa" hes. (4.3) 


—_ p 
dk+1 


którą nazywać będziemy przesuniętą intensywnością awarii rozkładu F. W przypadku, gdy 


nośnik jest skończony, N < o, przyjmujemy następującą konwencję u (N) = oraz 7 EW) =| 
Zatem możemy zapisać, że między funkcjami A i U zachodzi następująca relacja 
u(k) 
A(k) = ——.,_ kes. 4.4 


Stąd oraz z równości (4.2) dostajemy, że funkcja u jednoznacznie wyznacza F wzorem 


n 


Fn=[[L+u(X)"', nes. (4.5) 
k=0 


Ponadto z funkcja rozkładu prawdopodobieństwa zmiennej losowej X ma postać 


—__H(0) un H -1 a 
AGES, Pr=r run L+H) zo WS D2 ras Na (4.6) 
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Zauważmy, że dla dyskretnego rozkładu o nieskończonym nośniku (tj. N = ©), szereg 
Ezo A jest rozbieżny (zob. [51], Twierdzenie 1). Zatem ze wzoru (4.3) i z kryterium porów- 
nawczego zbieżności szeregów dostajemy, że szereg )/;_ race jest również rozbiezny. 

Poniższy lemat podaje warunek konieczny i wystarczający na to, aby pewna funkcja okre- 
Ślona na zbiorze S = 40, 1,... | była intensywnością awarii pewnego rozkładu prawdopodobień- 


stwa o nośniku S. 


Lemat 4.1. (/51||52]) Niech S = {0,1,...}. Funkcja A: S > [0,1) jest intensywnością awarii 
pewnego rozkładu prawdopodobieństwa o nośniku S wtedy i tylko wtedy, gdy 


Y A(k) =. (4.7) 


Uwaga 4.1. Rozbieżność szeregu oznacza, że iloczyn nieskończony [[;4_9(1 — A(k)) jest 
rozbieżny do 0. To z kolei zapewnia, że formuła poprawnie definiuje funkcję przeżycia 
rozkładu F. 


Wniosek 4.1. Z Lematu [4.i|i równości dostajemy, że w przypadku N = œ dowolna 

funkcja u: S + [0,°°) jest przesuniętą intensywnością awarii pewnego rozkładu (określonego 

przez (4.6)) wtedy i tylko wtedy, gdy u(k) > O dla wszystkich k = 0,1,2,... oraz szereg 
k 


Ło pr jest rozbieżny. Równoważnie, iloczyn [[;_g(1+ u(k))~' jest rozbiezny do 0, co 


implikuje, że funkcja przeżycia jest poprawnie zdefiniowana wzorem (4.5). 


4.2 Kryteria jednoznaczności charakteryzacji rozkładów 


dyskretnych przez regresje słabych rekordów 


W tym rozdziale rozwazamy regresje słabych rekordów postaci 
E(j) =E(h(W,40) |W-= j), j € S, gdzie h jest funkcją ściśle rosnącą. W odróżnieniu 
od przypadku ciągłego, funkcja h jest ograniczona z dołu, gdyż zbiór S jest dyskretny. 
Warunkiem istnienia tej regresji jest E |A(W,.40) | < co, Zauwazmy, ze warunek ten jest auto- 
matycznie spełniony jeśli S jest zbiorem skończonym (dla dowolnej funkcji h) lub jeśli S jest 
zbiorem nieskończonym, ale funkcja h jest ograniczona z góry. W przeciwnym razie istnienie 
E|h(W,4¢)| musi być dodatkowo założone. 

Zanim przejdziemy do najważniejszych w tym rozdziale rozważań, przypomnimy ja- 
kie informacje o rozkładzie prawdopodobieństwa niesie regresja kolejnych słabych rekor- 
dów (£ = 1). Symbolem A oznaczać będziemy operator różnicowy określony wzorem 


Af(n) = f(n+ 1) — f(n). Załóżmy, że dla pewnego naturalnego r > 1 zachodzi warunek 


Ś(1)=E(h(W,1)|W,=j), JES, (4.8) 
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gdzie h jest funkcją Ściśle rosnącą i taką, że E |A(W,. 1) < œ. Wychodząc od wzoru (1.26) dla 
funkcji regresji otrzymujemy równość 


N 
6()aq;=),prh(k), je. (4.9) 
k=j 


Następnie wyznaczając różnice pierwszego rzędu powyższego równania, po prostych prze- 


kształceniach, otrzymujemy równanie różnicowe 


[5 (6) -hlp =AS (Aaj, FES. (4.10) 


Z Lematu [L.5fi) dla j € S mamy &(j) > h(j). Stąd dzieląc ostatnie równanie przez & (j) — h(j) 
i stosując definicję funkcji pomocniczej dostajemy 


OO ED 
mocap oo 


Korzystając teraz ze wzoru (4.5) możemy zapisać funkcję F w postaci 


GNT AŚ N nee 
r-T (=) , nes, (4.11) 


lub równoważnie stosując wzór (4.6) możemy wyrazić funkcję rozkładu prawdopodobieństwa 
zmiennej losowej X, w terminach funkcji 6 i h następująco 


Po = 500) - (0) E(n+ 1) —h(n) 44 EG +1) ACA’ 


przy czym, gdy N < ~, to py = io EG+D=h(j) hh 


Zauważmy ponadto, że funkcja regresji spełnia następujące warunki: 


e w przypadku N < œ mamy py = qn, i wówczas ze wzoru (4.9) otrzymujemy równość 


(por. Lemat|I .5{iii)) 
E(N) = A(N); (4.13) 


4 l 
* w przypadku N = ©, iloczyn []j~o (i + gen) jest rozbiezny do 0 lub równoważ- 


nie 


=  AŚ() 
ŁEG+D=KO PE 


gdyż F(n) + O przy n — œ (por. Wniosek 4.1). Ponadto z tożsamości oraz 


wzoru (4.11) wynika warunek 


m. = AOR GOST Z WE 
EOT (z i) = lim 6 (1)q, = 0. (4.15) 
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W dowodzie głównego twierdzenia w tym rozdziale będziemy korzystać z następującego 
lematu. Jest to odpowiednik Lematów [2.2]oraz 


Lemat 4.2. Załóżmy, że S = {0,1,...,N}, gdzie N < œ. Ponadto 


(a) h,Ę: S — R są funkcjami ściśle rosnącymi i takimi, że 


© AG) <E] ES, 
e jeżeli N < œ, to E(N) =h(N). 


(b) T=(q,...,T%-1) jest dowolnym rozwiązaniem układu £ — 1 równań różnicowych (Tą = h) 
« aUt ea oes , 
Aqi;(j)=————A : ES, 1<i</£-1, (4.16) 
D= Eag 0 J 
takim, że 
h(j) < ulj) << alj) < El), JES, (4.17) 
przy czym: 
e jeśli N < œ, to 
GN) =hN)=Ś(N), 1<i<£-1, (4.18) 
e jeśli N =~, to 
co A . 
jG5J+1) — 1) 
oraz , 
n=l ; = 
| AŚ (i) 
lim 6 (n) (1 tern TS =0. (4.20) 
ne I (1) — t(j) 


Niech n(j) = § (J) + Liz, t(j), J € S, oraz 
a) 7 AGP „eg 
a= T+ a) — 


a dodatkowo G(N) = 0, jeśli N < œ. Wtedy G = 1 — G jest rozkładem prawdopodobieństwa 


na S takim, że dla słabych rekordów V, oraz V,--/ z rozkładu G mamy 
Ś()=E(h(V4v)|V-=j), JES. 


Dowód. Mnożąc równania (4.16) przez Ś(j) — t(j), a następnie sumując wszystkie równania 


stronami otrzymujemy 


An(j) | AŚ 27 
EQ—nn E-a 7S” (4.21) 
Zatem = | 
Aj=1--Ś0___ On jes, 


Gi-1) $(i+1)- 1G) 
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Jeśli teraz N < œ, to G(N) = 0, a więc A(N) = 1 i G jest rozkładem prawdopodobieństwa na 
{0,1,...,N}. Jeśli natomiast N = ©, to na mocy Lematu oraz warunku funkcja G 
określa jednoznacznie właściwy rozkład prawdopodobieństwa na {0,1,... }. 

Niech V1, V2,... oznaczają słabe wartości rekordowe z rozkładu G. Pokażemy teraz, że dla 


0 <i< @—1 oraz j€ S mamy 
ai) = Eas) | Vi = J), (4.22) 


gdzie To = $ oraz Tę = h. Zauważmy najpierw, ze dla rozkładu G mamy 


(| G 
HO) = Fay Gy’ 


(por. (4.5), (4.21) oraz definicja G). Ponadto, z mamy również 
At;(j) 


is a ior 
Hi T(J) — Ti+ (J) 
a więc na mocy definicji funkcji u (patrz (4.3)) 
AG(J a 
a e JES. (4.23) 


t(j) — Ti (j) 


Aby udowodnić równość (4.22), wystarczy pokazać, że dla j € S zachodzi 
N 
È mlp = tUa JES. (4.24) 
k=j 
Z równania (4.23) otrzymujemy po prostych przekształceniach następujące równanie 
Ti+1(k) Pe = Tilk) pe —ATi(K) gir = Ti(kK) aa — Tilk + 1)gr+1, 
dla k € 8S. Ustalmy 0 < j < L < N. Sumując ostatnie równanie po wszystkich k takich, ze 
J < k < L otrzymujemy 
L 
D t1(k) pe = Gay — (L+ Dans. 
k=j 


Jeśli N < oo, to py = gn Oraz na mocy mamy 7;+1(N) = 7;(N). Zatem (4.24) zachodzi 
w sposób oczywisty dla j = N. Dla j < N przyjmujemy w ostatniej równości L = N — 1. To 


daje 
N-1 


X, ti (k) pe = G(J)q; — G(N)qN. 
i=j 


Przenosząc ostatni składnik na lewą stronę otrzymujemy żądaną równość (4.24). 


Jeżeli natomiast N = o, to udowodnimy, że z warunku wynika, że 
lim T(L+ 1)qr1 =0. 
Loo 
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Jeśli lim; „w T)(L) < œ, to powyższa równość jest oczywista, gdyż qr+1 = G(L) +0, gdy 
L — », Załóżmy więc, że lim; oe T(L) = %, a więc 7;(L) > O dla dostatecznie dużych Z. Wtedy 
dla0<i</— 1 mamy 7; < &, a więc 


| SEE (1) = E Aś(j) p” 
0< Gl Dar = E+ GH ELH CEH (rz) * 


co dąży do 0, gdy L + œ na mocy (4.20). Udowodniliśmy zatem równość (4.24) dla 
i=0,1,...,/— I we wszystkich przypadkach. To z kolei dowodzi równości (4.22). Wystarczy 


teraz skorzystać z Lematu|1.1|aby zakończyć dowód lematu. 


Podamy teraz główne wyniki tego podrozdziału. Najpierw zajmiemy się przypadkiem / = 2, 


a następnie rozważymy ogólną sytuację. 


Twierdzenie 4.1. Dla ustalonego r > 1, niech W,,W,+42 będą słabymi rekordami z rozkładu 


o dystrybuancie F określonej na nośniku S = {0,1,...,N}, gdzie N < œ. Załóżmy, że h: SR 


jest funkcją ściśle rosnącą i taką, że E|h(W,+2)| < œ. Wówczas funkcja regresji 6: S > R 


określona wzorem 
E(j) = E (h(W,42)|W-= j), JES, (4.25) 


jednoznacznie wyznacza dyskretny rozkład F wtedy i tylko wtedy, gdy równanie różnicowe 


s I-A) ees au 
A = A ; S, 4.26 
y(j) (0-50) Cy JE (4.26) 
ma dokładnie jedno rozwiązanie y = Q( j) takie, ze 
h(j) < e(l) <é), JES, (4.27) 
przy czym: 
(a) jesli N < œ, to 
p(N) =6(N); (4.28) 
(b) jeśli N = œ, to 
= AŚ (j) 
= oœ 4.29 
PETTEE 2 
oraz , 
| T AŚ (j) ) 
l 1+ =. =), 4.30 
Jim 50 TT ( EH) - 90) oie 


Wtedy funkcja przezycia rozkładu F dana jest wzorem 


a Anti) \ „eg 
rN) , nes, (4.31) 


gdzie n(j) = &(j)+ (A), przy czym, gdy N < %, to F(N) = 0. 
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Dowód. Załóżmy, że dana jest regresja i określmy 
p(j) =E (h(W,+2) | W,+1 = j) « JES. (4.32) 
Wówczas z Lematu[I.1]z £ = 2 otrzymujemy 


(j) = E(9(W,+1) | W, = DE JE S. (4.33) 


Teraz, skoro funkcja Q, określona wzorem (4.32), jest funkcją regresji kolejnych słabych war- 
tości rekordowych, to na mocy spełnia ona warunek jeśli N < ©, a na mocy 
i spełnione są warunki i jeśli N = œ. Co więcej, stosując dwukrotnie Le- 
mat [1.5ķi), otrzymujemy &(j) > g(j) > h(j), dla j € S. Następnie wychodząc od zależno- 
ści (4.10) w połączeniu z warunkami oraz otrzymujemy układ dwóch równań 
różnicowych 
Ap(j) = le) — E(J]E(J), jes (4.34) 
AE (J) = EG) - eK): 
Wyznaczając u z drugiego równania, a następnie wstawiając do pierwszego, widzimy, ze Q 
dane wzorem (4.32) spełnia również równanie różnicowe (4.26). 
Zatem, jeśli € jest regresją (4.25), to równanie ma co najmniej jedno rozwiąza- 
nie spełniające warunki podane w wypowiedzi twierdzenia. Ponadto sumując stronami rów- 


nania (4.34) otrzymujemy łatwo 


An (j) reż 
HOL OWKAM = 


gdzie n(j) = €(j)+ ọ(j). Zatem stosując wzór otrzymujemy funkcję F wyrażoną wzo- 
rem (4.31). 


Z drugiej strony, na mocy LematuA.2]z £ = 2, każde rozwiązanie równania (4.26) spełnia- 


jące nierówność oraz warunki (4.28) lub (4.29) i (4.30) określa pewien rozkład prawdo- 
podobieństwa, dla którego zachodzi równość (4.25). Zatem liczba charakteryzowanych przez 


u(j) = 


tę równość rozkładów pokrywa się z liczbą rozwiązań równania różnicowego spełniają- 
cych oraz lub i (4.30). Jeśli istnieje dokładnie jedno rozwiązanie, to musi 
ono pokrywać się z funkcją p daną wzorem (4.32) i rozkład F jest wówczas wyznaczony jed- 
noznacznie. W przeciwnym razie istnieją przynajmniej dwa różne rozkłady, dla których zacho- 


dzi (4.25). 


Uwaga 4.2. Z równości (4.6) możemy określić rozkład prawdopodobieństwa przez regresję 6 


następująco 


An (0) PE An(n h(j) 


) U S(j) — 
An(n) +6 (n) — k(n) ANG) HEG) -AG) 0 


przy czym, gdy N < œ to py = [hs att 
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Uwaga 4.3. Zauważmy, że z układu równań (4.34) możemy wyznaczyć funkcję u na kilka 
równoważnych sposobów. Mianowicie funkcja u może być przedstawiona albo w terminach 
funkcji hi p, albo za pomocą funkcji € i g, albo jak w równaniu (4.35) za pomocą wszystkich 
wspomnianych wyżej funkcji. Łącząc ten wynik z możemy również wyrazić F za pomocą 
tylko hi @ albo za pomocą € i g. 

Zaznaczmy, że podobny problem charakteryzacyjny dla regresji słabych rekordów o od- 
stępie dwa był przedmiotem rozważań w pracy [B]. Twierdzenie 1 w orzeka, że regresja 
słabych rekordów z ¢ = 2 określa bazowy rozkład o nieskończonym nośniku jednoznacznie. 
Jednakże, nasze Twierdzenie |4.1|jest również prawdziwe dla rozkładów określonych na skoń- 
czonych nośnikach. Ponadto w powyższym twierdzeniu podajemy wzór określający funkcje 
rozkładu, czego nie było w dotychczasowych wynikach. Zwróćmy również uwagę, że prze- 
ciwnie do metody przedstawionej przez Alieva [3], nasze podejście daje się łatwo uogólnić na 
regresję słabych rekordów o większym odstępie / > 2. 

Przejdziemy teraz do rozszerzenia Twierdzenia|4.1|na przypadek regresji słabych rekordów 


o dowolnym odstępie większym niż 2. 


Twierdzenie 4.2. Dla ustalonych r > 1 i £ > 2, niech W,,W,+¢ będą słabymi rekordami z roz- 
kładu o dystrybuancie F określonej na nośniku S = {0,1,...,N}, gdzie N < œ. Załóżmy, że 
h: S — R jest funkcją ściśle rosnącą i taką, ze E |A(W,+0)| < œ. Wówczas regresja (1.13) okre- 


sla rozkład zmiennej losowej X, jednoznacznie wtedy i tylko wtedy, gdy układ £ — 1 równań 


różnicowych 


(HU) VA) zy, pied Bee 
Ege EG (437) 


gdzie yy = h ma dokładnie jedno rozwiązanie @ = (9i,...,Qr_1), które spełnia warunki 
oraz (4.18) lub (4.19) i (4.20) z T = (q;,...,Ty_1) zastąpionym przez Q. 


Wówczas funkcja przeżycia rozkładu F jest określona wzorem 


SALT IOWA 
ro- (zh) | nes ma 


gdzie funkcja n: S — R jest następująca 


£—1 
n0=50+Y), ois). (4.39) 
i=] 


Dowód. Załóżmy, ze dana jest regresja i oznaczmy @ = h. Następnie rozwazmy funk- 
cje p,, 0 < i < £— 1, określone wzorami (1.15). Wówczas z Lematu [1.1] otrzymujemy Q = 6. 
Ponadto, ponieważ każda funkcja 9; jest funkcją regresji kolejnych słabych rekordów, miano- 
wicie regresja Q+1(W,+:41) względem W,+;, to z Lematu [1.5{i) otrzymujemy Qj.) < Q; na $ 
dla0 < i < 2—1. Zatem 


h(j) < p_1(J) <- < P) < EG) JES. 
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Co więcej, jeśli N < oo, to na mocy (4.13) funkcje te spełniają warunek (4.18) z 7 zastąpionym 
przez @. Jeśli natomiast N = ©, to na mocy (4.14) i (4.15) spełnione są warunki (4.19) i (4.20) 


z Tı zastąpionym przez Q1. 


Dalej, funkcje te spełniają / równań różnicowych 


la) Gis (/)]Pj =A: O0<I<Ł-1, jes. (4.40) 
Zauwazmy, ze jest układem / równań £ z nieznanymi funkcjami @),...,@y_, oraz u 


(przypomnijmy, że Qy = 6 oraz Q, = h są znane). Aby wyeliminować u wyznaczamy tę funkcję 
z każdego równania. Zatem 

Agi(j) 
Pi(J) — Pi (j) 


O AG(j) 
HU) = 6-0) 


Porównując teraz prawą stronę ostatniego równania z prawą stroną równań (4.41) widzimy, że 


u(j) = , 1<i<e-1 (4.41) 


oraz 


funkcje Q,...,@e_, spełniają układ £— I równań różnicowych 
A DJ) — Pml) 
OEI 


Zatem, jeśli jest dana przez (1.13), to układ (4.37) ma co najmniej jedno rozwiązanie spełnia- 
jące warunki podane w wypowiedzi twierdzenia. Ponadto, sumując stronami wszystkie równa- 
nia w (4.40) otrzymujemy [5 (j) —h(j)]pj = A9(J)qj+1, a zatem u można przedstawić w po- 


staci u(j) = SR a Ponownie jak w Twierdzeniu 4.1] funkeje F można przedstawić w po- 


staci (4.38), a odpowiadająca funkcja rozkładu prawdopodobieństwa jest dana wzorem (4.36) 
z tą różnicą, że funkcja 1] jest określona teraz przez (4.39). 

Z drugiej strony na mocy Lematu 4.2) każde rozwiązanie układu spełniające nierów- 
ność oraz lub i określa pewien rozkład prawdopodobieństwa, dla 
którego zachodzi równość regresji (1.13). Jeśli zatem istnieje dokładnie jedno takie rozwiąza- 
nie, to musi ono pokrywać się z @ = (Qi,...,pr_1) określonym przez (1.15). Zatem F jest 


wyznaczona jednoznacznie. W przeciwnym razie jednoznaczność nie zachodzi. 


Uwaga 4.4. Oczywiście dla £ = 2 układ (4.37) redukuje się do jednego równania różnico- 
wego (4.26). Zatem Twierdzenie|4. I|jest szczególnym przypadkiem Twierdzenia 4.2] 


4.3 Jednoznacznos¢ charakteryzacji — szczególne przypadki 
dla l = 2 


Kryterium jednoznaczności charakteryzacji rozkładów dyskretnych przez regresje słabych 
wartości rekordowych (1.13) zaprezentowane w podrozdziale [4.2] podobnie jak kryteria jedno- 
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znaczności charakteryzacji rozkładów ciągłych przez regresje uogólnionych statystyk porząd- 
kowych jest z jednej strony łatwe do wyprowadzenia, ale z drugiej strony trudne w implemen- 
tacji. 

W ogólności, problem jednoznacznej charakteryzacji dyskretnych rozkładów prawdopodo- 
bieństwa przez regresje niekolejnych słabych wartości rekordowych sprowadzony został do roz- 
wiązania odpowiedniego równania (gdy £ = 2) lub układu równań różnicowych (gdy £ > 2) 
z nieklasycznymi warunkami ograniczającymi. 

Znalezienie rozwiązania takiego problemu w ogólnym przypadku wydaje się trudne do uzy- 
skania. W tym podrozdziale rozpatrzymy ten problem dla regresji słabych rekordów o odstępie 
£= 2 i wykażemy jednoznaczność rozwiązania szczególnego problemu różnicowego, która po- 
ciąga za sobą jednoznaczność charakteryzacji rozkładów prawdopodobieństwa przez regresje 


wartości rekordowych, dla następujących szczególnych przypadków: 
e h jest funkcją ograniczoną, a więc A(N) < o; 
e h jest funkcją nieograniczoną (h(N) = ©) oraz 6 jest funkcją asymptotycznie liniową 
względem funkcji h, mianowicie 


lim [é (j) — (ah(j) +b)| =0, (4.42) 


j>% 


dla pewnych a > 1,b €R. 


Uwaga 4.5. Jeżeli N < oo, to oczywiście mamy h(N) < œ. Jeżeli N = œ, to A(N) jest zdefinio- 
wana jako granica h(N) = lim j—œh(j), która w ogólności może być zarówno skończona, jak 


i nieskończona. 


4.3.1 Własności rozwiązań pomocniczego problemu różnicowego 


Niech będzie dany problem różnicowy następującej postaci 
a YG) -Al l 
wo =E a 
(i) —y(j) JES, (4.43) 
h(j) < yG) <Ś(J); 


gdzie h,¢ : S > R są ściśle rosnącymi funkcjami. 


Zauważmy, że ze względu na warunek ograniczający h < y < 6, dowolne rozwiązanie y 
powyższego problemu jest funkcją ściśle rosnącą. Inne własności rozwiązań problemu (4.43) 


podają kolejne dwa lematy. 


Lemat 4.3. Niech S = {0,1,...,N}, gdzie N < œ. Załóżmy, że h, 6: S > R są ściśle rosnącymi 


funkcjami takimi, że h(j) < &(j) dla j € Ś. Przypuśćmy, że Q,y: S + R są dwoma różnymi 
rozwiązaniami problemu (4.43). Wówczas 


EG) -AUJAS (J) 
EG) — PIS (A) — 
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(+1) 041) =D) -0 (14 2g) ies, (4.44) 


Dowód. Niech z = y— g. Wykonując proste przekształcenia otrzymujemy 


c(i), (4.45) 


co prowadzi do tezy lematu. 


Lemat 4.4. Przy założeniach Lematu|4.3|mamy 
(i) y(j) # QQ) dla j ES; 
(ii) albo y < 9, albo y > ọ na Š; 


(iii) jeżeli z = (y— 9)”, to z jest funkcją ściśle rosnącą na Š; 


(iv) jeżelih < y < Ọ oraz w = E to w(0) < w < 1 oraz w jest funkcją ścisle rosnącą na Š; 
(v) jeżeli p < y < 6 oraz w = = to w(0) < w < 1 oraz w jest funkcją ściśle rosnącą na S. 


Dowód. Zauważmy, że wyrażenie w nawiasach po prawej strony równania jest zawsze 
dodatnie. Zatem, jeżeli y(j) = o(j) dla pewnego j€ S, to y= @ na S, co kończy dowód 
punktu (i). Co więcej, z równości (4.44) widzimy, że różnica y( j + 1) — p(j +1) jest dodatnia 
wtedy i tylko wtedy, gdy wyrażenie y( j) — @(/) jest dodatnie, co dowodzi (ii). Jeżeli p <y<6, 
to z równości (4.45), różnica y — @ jest rosnąca oraz jeżeli h < y < Q, to różnica @ — y jest ro- 


snąca, do dowodzi (iii). Obliczając różnice pierwszego rzędu funkcji w = = otrzymujemy 


ivje AP(J)—Ay(J)_ || Pl) YU) P(J) —y(j 
p(J+1)-h(J+1l) o(J+1)-k(j+1t) p(j)—K(J) 
yG) -hlj 


co dowodzi (iv). Podobnie dla w = zA gdy y > @ otrzymujemy 


9 

Gigs AMUJ=ROU])" a SOU) __. YI) = OU} 

Ś(+1)-op(jt1l) 6(J+1)-9(J+1) 6()— oli) 
y) — PUJ) 


“RUFI G4 NED — 0G PW) 49)! > 


co kończy dowód punktu (v). 


4.3.2  Jednoznaczność charakteryzacji dla A(N) < œ% 


Następne twierdzenie orzeka o jednoznaczności charakteryzacji dyskretnych rozkładów 
prawdopodobieństwa przez regresje słabych wartości rekordowych (1.13) w przypadku gdy 
L = 2 oraz h jest funkcją ograniczoną, czyli h(N) < ». Zauważmy, że funkcja h jest zawsze 


ograniczona z dołu, a więc h(N) < œ implikuje, że E|h(W,+42)| < ce. 


83 


Twierdzenie 4.3. Dla ustalonego r > 1, niech W,,W,+2 będą słabymi rekordami z rozkładu 


o dystrybuancie F określonej na nośniku S = {0,1,...,N}, gdzie N < œ. Załóżmy, że h: SR 


jest funkcją ściśle rosnącą. Jeżeli h(N) < œ% (w szczególności, gdy N < ©), to regresja 
(J) =E(h(Wr2)|Wr=j), JES, 


jednoznacznie charakteryzuje rozkład zmiennej losowej X, określony dystrybuantą F, którą 


można wyznaczyć ze wzoru (4.31). 


Dowód powyższego twierdzenia jest podobny do dowodu Twierdzenia Jednakże dla 
kompletności rozważań przedstawiamy go w całości. 
Dowód. Z Lematu [L6Kiii) w przypadku A(N) < co mamy €(N) =h(N). Wiemy, że funkcja p 
określona przez jest rozwiązaniem równania różnicowego spełniającym nierów- 
ność oraz warunki lub i (4.30). Przypuśćmy, że istnieje również inne roz- 
wiązanie tego problemu y. Naturalnie @ i y są także rozwiązaniami problemu (4.43). W przy- 
padku, gdy N < » korzystając z warunku oraz z równości (4.44) otrzymujemy kolejno 


E(N) =y(N) = (N), P(N —1) =y(N—1),...,p(0) = y(0), czyli p = y. W drugim przy- 


= a zatem 


padku, gdy N = oo rozważając funkcję z = (y— 9)? mamy 0 <z(j) < (E(/) —h(J)) 
z(j) > 0, gdy j + œ. Ale z(0) > 0 oraz na podstawie Lematu|4.4{iii), z jest funkcją ściśle ro- 
snącą. To daje sprzeczność, czyli również Q = y. Pokazaliśmy zatem, że funkcja @ określona 


wzorem (4.32) jest jedynym rozwiązaniem problemu różnicowego (4.43). Teza twierdzenia wy- 


nika teraz z Twierdzenia 


4.3.3  Jednoznaczność charakteryzacji dla A(N) = » 


Dowód analogicznego wyniku dla przypadku, gdy h jest funkcją nieograniczoną, tj. N = 
i A(N) = œ oraz dowolnej funkcji regresji Ś, nie wydaje się łatwy. W takim przypadku nie 
możemy twierdzić, ze €(j) —h(j) zbiega do 0, gdy j > ©, a to jest kluczowe w dowodzie 
Twierdzenia 4.3] Rzecz jasna możliwe jest nawet, że funkcja € — h ma granicę niewłaściwą ©. 
Poniżej udowodnimy jednoznaczność charakteryzacji dla szczególnej postaci regresji €, mia- 
nowicie gdy jest ona funkcją asymptotycznie liniową względem funkcji h, tj. spełniony jest 
warunek (4.42). Oczywiście w takim przypadku z uwagi na założenie $ > h mamy a > 1 oraz 
jeżeli a = 1, to b > 0. Zauważmy, że w przypadku gdy a = 1 i b = 0 mamy przypadek analo- 
giczny jak w dowodzie Twierdzenia|.3] który implikuje żądaną jednoznaczność charakteryzacji 
(por. (2.42)). Zatem dla a = 1 możemy założyć, że b > 0. 


Lemat 4.5. Niech S = 40,1,2,... | oraz niech h,§: S + R będą ściśle rosnącymi funkcjami 
takimi, że h < 6. Załóżmy, że h(oo) = œ oraz 6 spełnia warunek (4.42) dla pewnych a > 1 
ib € R. Załóżmy, że problem różnicowy (4.43) ma rozwiązanie Q takie, że 


lim [g(i)— (h(j) +4)] =0 (4.46) 
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dla pewnych c> lid ER. 


(a) Jeżeli a = 1, to c = 1, d = b/2 > 0 oraz Q jest jedynym rozwiązaniem problemu (4.43). 
(b) Jeżeli a > 1, toc = ya € (1,a) oraz Q jest jedynym rozwiązaniem problemu (4.43). 


Idea dowodu powyższego lematu jest podobna do dowodu Twierdzenia jednakże dla 
kompletności rozważań przedstawiamy dowód w całości. 


Dowód. (a) Z warunku h < p < 6, dla dostatecznie dużych j € S, dostajemy 


h(j) h(j) 
Zatem oczywiście jeżeli a = 1, to również c = 1. Zauważmy również, że z warunków 
oraz wynika, że lim; w oe = 1 oraz lim;-,.[§(j) — (j) =b-d > 0. 
Ktadac 
A) _ PV) —k(J) 
(i= AS se (4.47) 
AS(j) $i) — oli) 
otrzymujemy (j) > zi gdy j — œ. Stosując teraz twierdzenie Stolza otrzymujemy, ze 


oe + 54 gdy j  ». Z drugiej strony wiemy, że granica ta jest równa 1, zatem 


d 
je 
b—d 


Stąd d = b/2 > 0. 
Załóżmy teraz, ze y jest innym rozwiązaniem problemu (4.43) spełniającym warunek 


h < y< 6. Wówczas dla dostatecznie dużych j mamy 


SEOBEAO 


h(i) ` h(j)’ 


a skoro lim js. = = 1, to również lim;_,« m = | oraz lim jo " =. 


Na podstawie Lematu |4.4{ii) wiemy, że p < y albo y < @. Jeżeli p < y < &, to rozważmy 
funkcję z = y— 9. Z Lematu 4.4{iii) funkcja z rośnie od z(0) > 0 do stałej C € (z(0),b/2]. 
Załóżmy najpierw, że C < b/2. Definiując 


yy) = WU) U) + 0) =A) m 


AEG) 56-00) =i) 
C+b/2 


a następnie przechodząc do granicy, gdy j — © dostajemy ¥(j) > 7 TIC" Ponadto z klasycz- 


nego twierdzenia Stolza otrzymujemy równość 


mo ada > ŻE 
ih=»€(j)  jreA€(j) b/2-C 


Z drugiej strony wiemy juz, ze granica po lewej stronie wynosi 1. Zatem 


85 


| - C+b/2 


~ b/2-C’ 
a więc C = 0. Sprzeczność. Gdyby natomiast C = b/2, to ¥(j) > ©, gdy j o. Na mocy 
y(j) 


twierdzenia Stolza otrzymamy wówczas, że Ej) 7? ©, CO przeczy temu, zey<€naS. 
Analogicznie dla przypadku, gdy h < y < g, wystarczy rozważyć funkcję z =  — y, aby 
dojść do kolejnej sprzeczności. Zatem Q jest jedynym rozwiązaniem problemu (4.43). 
(b) Dowód lematu dla a > 1 jest oparty na tym samym pomyśle co dowód dla punktu (a). 
(j) j 


Zauważmy, że lim; „e > = a oraz lim jo | 


p(j) _ 


= c, co implikuje 


(4.49) 


c 
im — = -. 

joe (jf) a 
Oczywiście 1 < c < a. Przypuśćmy najpierw, że c € (1,a). Przedstawiając funkcję © określoną 


przez (4.47) następująco 


NN J 
OSG, ou) 


a następnie przechodząc do granicy, gdy j © otrzymujemy ®(j) > e, Łącząc ten wy- 
nik z warunkiem dostajemy równanie kwadratowe c? = a, które w przedziale (1,a) ma 
dokładnie jedno rozwiązanie c = ya. Gdyby c = 1, to lim; (j) = 0, a gdyby c = a, to 
lim;_,o P(j) = ». W obydwu tych przypadkach, z twierdzenia Stolza otrzymujemy sprzecz- 
ność z warunkiem (4.49). 

Załóżmy teraz, że y jest innym rozwiązaniem problemu (4.43). Jeżeli granica 
L(y) = lim; c pe istnieje, to powtarzając rozumowanie z punktu (a) dostajemy, ze 
L(y) € (1,a) oraz LO) = ae Ale to równanie określa jednoznacznie c, zatem L(y) = c dla 
dowolnego y będącego rozwiązaniem problemu (4.43). 

Jeżeli p < y < 6, to rozważmy funkcję w = = Z Lematu atv) funkcja w rośnie od 
w(0) > O do C € (w(0), 1]. Zauważmy, że funkcja ¥ określona przez może zostać przed- 


stawiona w postaci 


Załóżmy najpierw, że C < 1. Wtedy otrzymujemy, że granica funkcji ¥ w nieskończoności 


istnieje 1 jest równa —©. Na mocy twierdzenia Stolza otrzymujemy istnienie również granicy 


lim joo z = => Z, przedstawienia z = 7 : g otrzymujemy istnienie granicy lim;_,« 14 co 
prowadzi do równości 

G C+. 

a 1-C 
Stąd dostajemy C = 0, co daje sprzeczność. Gdyby natomiast C = 1, to F(j) + ©, a z twier- 


dzenia Stolza otrzymamy również 2U) _, oo, gdy j  ». Co z kolei przeczy temu, że y < 
EU) przeczy 


na S. 
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Jeżeli h < y < @, to wystarczy przeprowadzić podobne rozumowanie z wykorzystaniem 


funkcji w = CS 


blemu (4.43). 


Stosując teraz Lemat|4.5]w połączeniu z Twierdzeniem/A. I|otrzymujemy jednoznaczną cha- 


aby uzyskać kolejną sprzeczność. Zatem Q jest jedynym rozwiązaniem pro- 


rakteryzację dyskretnych rozkładów prawdopodobieństwa przez asymptotycznie liniowe regre- 


sje słabych rekordów o odstępie dwa. 


Twierdzenie 4.4. Dla ustalonego r > 1, niech W,,W,+2 będą słabymi rekordami z rozkładu 


o dystrybuancie F określonej na nośniku S = {0,1,...}. Załóżmy, ze h: S R jest funkcją 


ściśle rosnącą i taką, że E |h(W,42) | < œ oraz h(o0) = œ. Jeżeli regresja 6: S — R określona 
wzorem (4.25) spełnia warunek (4.42) dla pewnych a > 1, b € R oraz problem różnicowy (4.43) 
ma rozwiązanie Q, które spełnia warunek (4.46), to funkcja regresji 6 jednoznacznie wyznacza 


rozkład prawdopodobieństwa, którego funkcja przeżycia F dana jest wzorem (4.31). 


Wiemy już, że warunek za=l oraz b = 0 implikuje jednoznaczność charakteryza- 
cji rozkładu F przez regresję (4.25). Wykażemy teraz, że dla dużej klasy dyskretnych rozkła- 
dów prawdopodobieństwa można zweryfikować ten warunek jedynie na podstawie znajomości 
funkcji intensywności awarii tych rozkładów, bez konieczności wyznaczania funkcji regresji &. 
Analogiczny wynik otrzymaliśmy w Lemacie|2.4|dla rozkładów absolutnie ciągłych. 


Lemat 4.6. Jeżeli h(j) = j oraz lim u(j) = ©, to spełniony jest warunek 
j>% 


im (6(5) —h(j)] =0. 


joe 


Dowód. Wychodząc od równości (1.26) warunki (4.32) oraz (4.33) możemy odpowiednio za- 


pisać w postaci 


1 foe} 
(j) = E (A(W,+2) | Wri = j) = 7 $ prh(k) (4.50) 
J k=j 
oraz 1 a 
E (j) = E (P(W;+1) |W- = j) = a Y polk). (4.51) 
J k=j 


Zauważmy, że równanie możemy przedstawić w postaci (w przypadku gdy h(j) = j) 


Następnie, korzystając z twierdzenia Stolza dla wyrażenia typu o (ciąg {q;} jest ściśle malejący, 


a a bz j+14k = ie qj =) obliczamy granicę 


| | Na Ea 
im (90) -4()] = lim —— =0. 
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Podobnie, równanie (4.51) można przekształcić do postaci 


EqQ=al)+— F, (k-pr+— -iLE c-am) 
qj I=k+1 


di k=j+l J k=j dk 

k| ~ 
pid = y qk + yć ( > a) 

dj k=j+1 dj k=j dk Mi=k+ 
i ponownie korzystając z twierdzenia Stolza dla wyrażenia typu 5 dostajemy 

im [5() —h()] = 2 lim —— = 0 
1m = = im —~ =U. 

je że GG) 


To kończy dowód. 


Wniosek 4.2. Jeżeli lim u(j) = ©, to rozkład F jest jednoznacznie określony przez regresję 
mó 


Ś(J) =E (Wr+2 | W, = j) . (4.52) 


Uwaga 4.6. Niestety, podejście przyjęte w tym podrozdziale wydaje się trudne do przeniesie- 
nia na ogólny przypadek £ > 3. Dlatego też, problem jednoznacznej charakteryzacji rozkładu 


w takim przypadku jest nadal otwarty. 


4.4 Przykłady nowych charakteryzacji rozkładów dyskret- 
nych 


W tym podrozdziale zaprezentujemy nowe przykłady charakteryzacji dyskretnych rozkła- 
dów prawdopodobieństwa przez funkcję regresji słabych rekordów 6 (j) = E(W,+2 | W, = j), 
j € S, dla dowolnie ustalonego r > 1. Zaznaczmy, że we wszystkich prezentowanych w tym 
podrozdziale przykładach funkcja regresji € jest nieliniowa. Przypadek liniowej regresji zosta- 
nie przedstawiony w kolejnym podrozdziale. 

We wszystkich prezentowanych poniżej przykładach, dla badanych rozkładów prawdopodo- 
bieństwa, zostały najpierw wyznaczone funkcje regresji 6, a następnie zostały zweryfikowane 
warunki jednoznacznej charakteryzacji tych rozkładów przez wyznaczoną funkcję regresji sła- 
bych rekordów. 

Pierwszy przykład dotyczy charakteryzacji dyskretnych rozkładów prawdopodobieństwa 


o skończonym nośniku. 


Przykład 4.1. (a) Niech S = 40, 1,2) oraz h(j) = j, j € S. Ponadto przypuśćmy, że 


6(0)-3, 60)=4, O= (4.53) 
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Chcemy znaleźć wszystkie rozkłady prawdopodobieństwa po, pi, p2 o nośniku S, dla któ- 


rych prawdziwa jest następującą relacja 
E(W,+2 | W.) = 5 (W,) 


dla dowolnie ustalonego r > 1. Mając na uwadze wyniki prezentowane w podrozdzia- 
łach [4.2] i [4.3] nasze zadanie sprowadza się do wyznaczenia funkcji p: S — R, która jest 
rozwiązaniem problemu różnicowego (4.43), takim, że p(2) = 2. Zatem wystarczy znaleźć 


a=©(0) oraz b = g(1) takie, że a < b, a € (0, >) oraz b € (1, i). Z równania różnico- 
wego (4.43) dostajemy układ dwóch równań 


Z drugiego równania otrzymujemy równanie kwadratowe 4b? — 16b+ 15 = 0, które ma dwa 
rozwiązania bj = 3 oraz b2 = 3. Zauważmy, że b leży poza przedziałem (1, 4) , dlatego też 
b= 3. Wstawiając to rozwiązanie do pierwszego równania otrzymujemy kolejne równanie 
kwadratowe 8a? — 26a + 15 = 0, które ma dwa rozwiązania a, = 3 oraz a = 4. Tylko 
drugie z tych rozwiązań leży w przedziale (0, >) zatem a = 3. Na mocy Twierdzenia 4.3 
regresja charakteryzuje bazowy rozkład prawdopodobieństwa jednoznacznie. W tym 
przykładzie mamy z n (0) = 2, n(1) = B i n(2) =4, a wiec z równania otrzymujemy 


po=zipi=p2=4. 


(b) Podobnie, jeżeli S = {0,1,2,3} oraz h(j) = j dla j € S, to funkcja regresji 
37 29 23 
600=3, =F, £20=5, $6)=3, 


jednoznacznie charakteryzuje rozkład prawdopodobieństwa 


Po = P2 = P1 = P3 = 


1 1 

3 6 

Aby to wykazać postępujemy analogicznie jak w punkcie (a). Najpierw znajdujemy roz- 
wiązanie problemu różnicowego (4.43), który w tym przykładzie sprowadza się do rozwią- 
zania kolejno trzech równań kwadratowych. Wychodząc od g(3) = 3 oraz uwzględniając 
warunek h < p < 6 znajdujemy kolejno @(2) = i, (1) =2 oraz g(0) = 4, Następnie ze 


wzoru (4.36) wyznaczamy funkcję rozkładu prawdopodobieństwa. 


Procedura zilustrowana w powyższym przykładzie może zostać zastosowana do znalezienia 
rozkładu prawdopodobieństwa o skończonym nośniku S charakteryzowanego przez dowolną 
funkcję regresji € słabych wartości rekordowych. Zasadniczo algorytm składa się z dwóch kro- 


ków. W pierwszym rozwiązując układ równań kwadratowych znajdujemy wartości funkcji Q 
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począwszy od p(N — 1) do g(0). W drugim kroku przekształcamy wartości funkcji 6, h oraz @ 
na wartości funkcji rozkładu prawdopodobieństwa zgodnie ze wzorem (4.36). Poprawność tego 


algorytmu wynika z Twierdzenia 4.3] Formalny zapis algorytmu znajduje się poniżej. 


Algorytm 1 Wyznaczanie rozkładu prawdopodobieństwa determinowanego przez regresję 
h(W,+2) względem W, 
Require: n-elementowy wektor 6 wartości funkcji regresji č oraz n-elementowy wektor h 


wartości funkcji h 
1: @[n| —hln] 
2: for i — n— 1 downto | do 
3: fi] SOLVE: (gli+ 1] —x)($Ś[i] —x) = (@—Ali]) (i+ 1] — $[1]); 
pod warunkiem hli] < x < & [i] 
4: end for 
5 n<§€+ 
6: fori — 1 "i IE nii 
to EC EM] 
8: end for 
ll) 


; 1 
10: for i — RT do 

, F Hi i—1 =] 
11: pli] — ital TT, + IA) 
12: end for 
13: pln] — To, U + uik) 
14: return p 


1 


Zaznaczmy, że z uwagi na ilość wymaganych obliczeń zależnych od liczby 
N prościej jest znaleźć wartości funkcji @ oraz funkcję rozkładu prawdopodobień- 
stwa numerycznie. Przykładowo, jeżeli N = 5, (S = 40,1,2,3,4,5)), a funkcje 6, h 
są określone przez wektory 6 = (3.4,3.6,4.1,4.4,4.6,5), h = (0,1,2,3,4,5), to funk- 
cja będąca rozwiązaniem problemu różnicowego (4.43) określona jest przez wektor 
@ = (2.2156982, 2.5898761,3.3768469, 3.9480318,4.3675444, 5), a rozkład prawdopodobień- 
stwa determinowany przez relację regresji 6(j) = E(W,+2 | W, = j) jest określony przez 
wektor p = (0.1444772,0.2832625,0.1677932,0.1240757,0.1773351,0.1030563). Powyższe 
rozwiązanie zostało wyznaczone numerycznie przy użyciu funkcji zaimplementowanych 
w środowisku R. 

W drugim przykładzie podamy nową charakteryzację pewnego rozkładu dyskretnego o nie- 


skończonym nośniku. 


Przykład 4.2. Załóżmy, że S = {0,1,2,...} oraz py = żć3 dla k =0,1,2,.... W przykładzie 
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tym korzystać będziemy ze znanych wzorów dla sum szeregów: 


y w=, (4.54) 
rm |= 
0 s AŻ 
kó*'=| — ml — : 4.55 
Ln (=) e" —x) a (4.55) 
oraz 
co z 
L k(k +1)? = (4) [n(n + Da (a8 ((n+ 1)x"— nx"*!)] ; (4.56) 
k=n m 
o ile |x| < 1. 
Stosując odpowiednio wzory (4.54) i (4.55) łatwo sprawdzić, że 


— n+2 
an= | Pk= zagr nEs. 
=n 


Ustalmy r > 1 i niech p(n) = E(W,+2 | W,+1 = n) oraz é (n) = E((W,+1) | W- = n) dla 
n € S. Z równości (1.26) mamy 
9n+1 o0 


1 oo 
=— Y kp, = k(k+1)2 2), 
p(n) ae Pk "+22 (k+ 1) 


Dalej, wprost ze wzoru (4.56) dostajemy 


p(n) = E(W,+2 | West =n) =n+1+ 


n+2 
Oczywiście @ spełnia warunek (4.46) (asymptotycznej liniowości) z parametrami c = d = 1. 
Ponownie korzystając z równości (1.26) dostajemy 


1 00 9n+1 00 2 
zna = 14+ —~ | (k+1)27 +2), 
0) = È op a (e +s) +1) 


Stosując teraz wzory (4.54)-(4.56) możemy sprowadzić powyższe wyrażenie do następującej 
postaci r 
é (n) = E(9(W,41) |W, =n) =n+2+ ——- +R(n), 


n+2 
gdzie 
"Z 2 k+1 
R — NSE. 2 2—(k+2) 
ares, a k+2 
Zauważmy, że 
ante = (2) _ 2 
0<R < 2 z= 
"NAŻ n+2 pa n+2 


Stąd R(n) + 0, gdy n — ©, a więc é jest funkcją asymptotycznie liniową, spełniającą wa- 
runek (4.42) z parametrami a= 1 i b = 2. Zatem na mocy Twierdzenia 4.4] Pk = ii, 


k=0,1,2,... jest jedynym rozkładem określonym na nośniku S, dla którego zachodzi warunek 


> 
E(W„o|W,=n)=n+2+ —— +R(n), . 
(W2 |W,=n) =n+ tzie * (n), nes 
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W kolejnych przykładach wykazujemy jednoznaczność charakteryzacji dwóch bardzo do- 
brze znanych dyskretnych rozkładów prawdopodobieństwa przez odpowiadające im regresje 


słabych wartości rekordowych nie znając ich jawnych postaci. 


Przykład 4.3. Rozważmy rozkład Poissona określony następującą funkcją rozkładu prawdo- 
podobieństwa 
gk 
Pk = y eLO) k=Q,1..... 0>0. 
Korzystając z twierdzenia Stolza łatwo dostajemy, że u (k) — ©, gdy k — oo, Zatem na mocy 
Wniosku możemy stwierdzić, że rozkład Poissona jest jednoznacznie charakteryzowany 
przez odpowiadającą mu regresję słabych wartości rekordowych (4.52), mimo że nie znamy 


analitycznej postaci tej funkcji. 


Przykład 4.4. Dla rozkładu ujemnego dwumianowego określonego następującą funkcją roz- 


kładu prawdopodobieństwa 


k-1 


otrzymujemy (po zastosowaniu twierdzenia Stolza) u(k) > i: > 0, gdy k — ». Przeprowa- 


dzając dalej rozumowanie jak w dowodzie Lematu 4.6|dostajemy, że 


. f 1 1—p 
ple N= ie PS 
oraz 1 
; „l =) 
_ki= DE AE 
es "ROW 


Zatem, dla dowolnego rozkładu ujemnego dwumianowego odpowiadające mu regresje słabych 
wartości rekordowych & oraz @ spełniają odpowiednio warunki oraz za=c=]l. 
Co więcej, wiemy, że @ jest rozwiązaniem problemu (4.43). Zatem z Twierdzenia [4.4] dosta- 
jemy, że rozkład ujemny dwumianowy jest jednoznacznie charakteryzowany przez odpowiada- 


jaca mu funkcję regresji €. 


4.5  Liniowość regresji słabych rekordów o odstępie dwa 


W tym podrozdziale wykorzystamy wyniki otrzymane w podrozdziałach |4.2]i|4.3]do prze- 
analizowania problemu charakteryzacji rozkładów prawdopodobieństwa przez liniowość regre- 
sji słabych rekordów o odstępie dwa, to znaczy regresji W, względem W,., dla pewnego na- 
turalnego r > 1. Pierwsze rozwiązanie tego problemu zostało podane przez Wesołowskiego 
i Ahsanullaha w pracy [57], powiązane wyniki można znaleźć również w pracy [3]. 

Rozpoczniemy od podania definicji trzech rozkładów prawdopodobieństwa charakteryzo- 
wanych w tym podrozdziale (por. [34]) 
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(1) nh;(a,B,n) — ujemny rozkład hipergeometryczny pierwszego rodzaju z funkcją roz- 


kładu prawdopodobieństwa daną wzorem 


AAC 2 
(BA 


n 


Pk = 


gdzie a,  € R są parametrami takimi, że p + 1 > a > O, natomiast n € N; 


(2) nhq(a,B,Y) — ujemny rozkład hipergeometryczny drugiego rodzaju z funkcją rozkładu 


prawdopodobieństwa daną wzorem 


Cr) 
Dk = L TB z JEZU, kas 
ek: r] 


gdzie a, B,y € R są parametrami takimi, że œ > 0, p +1 > y> 0; 


(3) ge(p) — rozkład geometryczny opisany następującą funkcją rozkładu prawdopodobień- 
stwa 
Pr = p(1—p)*, k=0,1,..., 


gdzie p € (0,1). 
Załóżmy najpierw, że dla ustalonej liczby naturalnej r > 1 zachodzi liniowa regresja W,+ 1 


względem W, 
E (Wmi |We=j)=aj+b, jES, 


dla pewnych a,b € R. Wówczas oczywiście a > 0 oraz b > 0 oraz korzystając z (4.11) lub (4.12) 


można w prosty sposób wykazać, że możliwe są tylko trzy następujące przypadki: 


(i) 0<a<1,N=b/(1—a)< » oraz X; ma rozkład ujemny hipergeometryczny pierwszego 


rodzaju nh;(1,B,n) z parametrami B = a/(1—a),n=N; 
(ii) a= 1, N = œ oraz X; ma rozkład geometryczny ge(p) z parametrem p = 1/(1 +b); 


(ii) a > 1, N = œ oraz X; ma rozkład ujemny hipergeometryczny drugiego rodzaju 
nh,r(1,B,Y) z parametrami B = (b+1)/(a—1)iy=b/(a—1). 


Zatem warunek liniowej regresji kolejnych (/ = 1) słabych rekordów determinuje jedno- 
znacznie trzy rodziny dyskretnych rozkładów prawdopodobieństwa, które są zależne od war- 
tości współczynnika kierunkowego prostej regresji. Powyższy wynik dla nieskończonego no- 
śnika S został podany w pracach [2] i [54]. Kompletna charakteryzację rozkładów prawdopo- 
dobieństwa, obejmującą również skończony nośnik S, przez liniowe regresje kolejnych słabych 
rekordów podali Wesołowski i Ahsanullah w pracy [57]. Udowodnili oni również, że te same 


trzy rodziny rozkładów prawdopodobieństwa są charakteryzowane, jeśli założymy liniowość 
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regresji słabych rekordów o odstępie £ = 2. Poniżej stosując Twierdzenia |4.3]oraz 4.4] podamy 
inny prostszy i bardziej bezpośredni dowód tego wyniku. 
Załóżmy, ze dla ustalonej liczby naturalnej r > 1 zachodzi liniowość regresji W,-+2 wzglę- 
dem W, 
E(W,42|W,=j)=aj+b, jeS, (4.57) 


dla pewnych a,b € R. Z własności funkcji regresji (Lemat otrzymujemy, że a > 0 oraz 
b > 0. Ponadto 


"> , , WEN, gdy O<a<l, 
N=inffj=0,1,...:aj+b=j]|= 


oo, gdy a>l. 
Naszym zadaniem jest znalezienie funkcji y, która jest rozwiązaniem następującego problemu 
różnicowego 
y(J)-J 
Ay(j)=a—— ja 
aj+b—y(j) JES. (4.58) 
J <y(j) <aj+b, 


Sprawdźmy najpierw, czy istnieją liniowe rozwiązania tego problemu mające postać 
y(j) =cj+d. (4.59) 


Oczywiście c > 0 oraz d € (0,b). Podstawiajac a = 1 do otrzymujemy y(j) = j+d oraz 
1 = d/(b — d), co daje d =b/2 e (0,b). Jeżeli natomiast a Æ 1, to 
— cj+d-j 
aj+b—(cj+d) 


Stąd dostajemy równanie (a —c)cj + (b—d)c = a(c — 1)j+ad, z którego wynika następujący 
układ równań 

(a—cjc=a(c—l), 

(b—d)c=ad. 
Pierwsze równanie jest równaniem kwadratowym c” = a, które ma tylko jeden dodatni pierwia- 


stek c = ya. Natomiast z drugiego równania otrzymujemy 


b 
d= =. 
l+ya 


Podsumowując, jeżeli a > 0 i b > 0, to problem różnicowy ma dokładnie jedno rozwiąza- 


€ (0,b). (4.60) 


nie liniowe @(j) =cj+d takie, że c = 1 oraz d = b/2, gdy a= 1, w przeciwnym razie c= va, 
a parametr d jest dany przez (4.60). 

W następnym kroku musimy wykazać, że badany problem nie ma innych rozwiązań. 
Jeżeli 0 < a < I, to N =b/(1—a) < œ. W tym przypadku jednoznaczność rozwiązania (4.59) 
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dostajemy z Twierdzeniak.3] Dla a > 1 mamy N = », tak więc h(N) = » i nie możemy zastoso- 
wać Twierdzenia|4.3|jak wyżej. Jednakże, jednoznaczność rozwiązania problemu w tym 
przypadku wynika z Twierdzenia [4.4] Bezpośrednie rachunki pokazują, że Q spełnia również 
warunki (4.28), oraz (4.30). 

W ostatnim kroku wystarczy skorzystać z lub (4.36), aby otrzymać trzy rodziny dys- 
kretnych rozkłady prawdopodobieństwa takie same jak dla liniowej regresji kolejnych słabych 


wartości rekordowych. 


Twierdzenie 4.5. Niech 4X,, n > 1} będzie ciągiem niezależnych zmiennych losowych o jed- 
nakowym rozkładzie z nośnikiem S = 40,...,N), gdzie N < œ. Załóżmy, że zachodzi liniowość 
regresji (4.57). Wówczas a > 0, b > 0, i możliwe są tylko trzy następujące przypadki: 


(i) 0<a< 1 oraz X; ma rozkład ujemny hipergeometryczny pierwszego rodzaju nh;(1, B,n) 
z parametrami B = (a + /a)/(1—a) orazn=b/(l—a); 


(ii) a= 1 oraz X; ma rozkład geometryczny ge(p) z parametrem p = 2/(2+b); 


(iii) a > 1 oraz X, ma rozkład ujemny hipergeometryczny drugiego rodzaju nhy(1,B, 7) z pa- 
rametrami B = (b+ ./a+1)/(a—1) oraz y=b/(a— 1). 


Podkreślmy, że zaprezentowany nowy dowód powyższego twierdzenia bazuje na rozwiąza- 
niu równania różnicowego pierwszego rzędu, podczas gdy dowód podany w pracy wymaga 
rozwiązania równania różnicowego drugiego rzędu, co jest znacznie trudniejsze. 

Na koniec tego podrozdziału zaznaczmy, że w ogólnym przypadku, gdy £ > 2 problem cha- 
rakteryzacji rozkładu przez regresje słabych rekordów jest tylko częściowo rozwiązany. Pro- 
blem jest nadal otwarty, gdy £ > 5i a > 1 [38]. 


4.6 Charakteryzacje przez regresje zwykłych rekordów 


Na zakończenie tego rozdziału odniesiemy się do charakteryzacji rozkładów prawdopodo- 
bieństwa przez regresje zwykłych rekordów dyskretnych (1.28). Wiemy, że zwykłe rekordy 
w przypadku dyskretnym są poprawnie określone tylko dla zmiennych losowych o nieskończo- 
nym nośniku S = {0,1,2,...}. Ponadto zwykłe rekordy tworzą ciąg Ściśle rosnący, tak więc 
każdy kolejny rekord przekracza poprzedni o co najmniej 1, zatem R, > r— 1 dla r > 1. Wiemy 
również, że ciąg dyskretnych rekordów {R,, r > 1) tworzy łańcuch Markowa z prawdopodo- 
bieństwami przejścia (1.4). Stąd pojawia się naturalne pytanie, czy podobne kryterium jedno- 
znaczności jak dla słabych rekordów można wykazać również dla zwykłych rekordów. 

W kontekście charakteryzacji rozkładów prawdopodobieństwa należy zaznaczyć, że wa- 


runkowy rozkład prawdopodobieństwa R,,; pod warunkiem R,, a w konsekwencji regresja 
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R,+1 względem R, nie zawiera informacji o prawdopodobieństwach po, p1,..., pr-1 wystąpie- 
nia wartości O, 1,...,r — 1. Zatem dysponując funkcją regresji zwykłych rekordów nie możemy 
jednoznacznie wyznaczyć całego rozkładu prawdopodobieństwa. Możliwe jest tylko otrzyma- 
nie ich ogonów pr, pr+1,.... 

Korzystając z rekurencyjnej struktury wynikającej z własności Markowa oraz z własności 
regresji wartości rekordowych przedstawionych w Lemacie[1.7]możemy otrzymać następujący 


wynik, będący odpowiednikiem Twierdzenia |4. 1 


Twierdzenie 4.6. Dla ustalonego r > 1, niech R,, R-+2 będą rekordami z rozkładu o dystrybu- 


ancie F określonej na nośniku S = 40,1,... |. Załóżmy, ze h: S + R jest funkcją ściśle rosnącą 


i taką, że E |A(R-+2)| < œ. Wówczas funkcja regresji 6 : {r—1,r,...} R określona wzorem 


Ó(J)=E(h(Rr42)|R,=J), j>r-l, (4.61) 
charakteryzuje jednoznacznie ogon rozkładu F wtedy i tylko wtedy, gdy równanie różnicowe 


~ SED HAIL) en, 
Ay(j) = EGED yG DASO IZ (4.62) 


ma jednoznaczne rozwiązanie y = g(j) na SĄ40,1,...,r— 1} spełniające warunki 


h(j+2)<@G+) <6), Jzr-l1, 


LED-I 


oraz 


tel. MED. 
LEGE UO) = 


j=r 
Oczywiście, wzory określające funkcję rozkładu F są podobne do przypadku regresji sła- 
bych rekordów, aczkolwiek potrzebne są pewne modyfikacje. Mianowicie, jeżeli pg,..., Pr—1 


są znane to q, oraz F (r — 1) = q, są również znane. Wtedy można pokazać, że dla n > r 


F(n) = wT] (1 7 O O) l 


Kryterium jednoznaczności charakteryzacji rozkładów prawdopodobieństwa określone 
w Twierdzeniu [4.6] okazuje się trudniejsze w użyciu niż dla przypadku słabych rekordów. Dla 
równania różnicowego nie można przeprowadzić analogicznego rozumowania jak w pod- 
rozdziale|4.3.1|dla słabych rekordów. W szczególności próba udowodnienia odpowiednika Le- 
matu |4.3|prowadzi do następującej relacji (por. równanie (4.44)) 

[5 (+1) —k(J+1)]A6 (J) ) 
60G+1)-o0G+DIISG+1) -v(G+1]/ 


0) - 96) =bd+1)-9(+D] (1 - 
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Przeciwnie niż to było dla przypadku słabych wartości rekordowych nie znajdujemy argumen- 
tów świadczących o tym, że wyrażenie w nawiasach po prawej stronie powyższego wyrażenia 
jest dodatnie. Z tego powodu nie możemy zastosować analogicznego rozumowania jak w do- 
wodzie Lematu Pytanie jak wykazać, że p(j) = E (h(R,+2) | Rr+1 = J) jest jedynym roz- 
wiązaniem równania różnicowego (4.62), a co za tym idzie, że regresja zwykłych rekor- 
dów jednoznacznie charakteryzuje ogon dyskretnego rozkładu prawdopodobieństwa pozostaje 


otwarte. 
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Podsumowanie 


W niniejszej pracy zaprezentowaliśmy całkowicie nowe podejście do znanego pro- 
blemu charakteryzacji rozkładów prawdopodobieństwa przez regresje modeli uporządkowa- 
nych zmiennych losowych. Nasze podejście oparte na własności Markowa rozważnych mo- 
deli, polega na przeformułowaniu problemu. Mianowicie wyjściowy problem charakteryza- 
cyjny zostaje zastąpiony nowym problemem albo różniczkowym, albo całkowym, albo różnico- 
wym z niestandardowymi warunkami ograniczającymi. Takie postawienie problemu przesuwa 
aspekty probabilistyczne i statystyczne problemu na drugi plan. Główny problem znajduje teraz 
miejsce w teorii równań różniczkowych bądź całkowych, bądź różnicowych. Zaprezentowane 
wyniki są zupełnie nowe, nawet dla najpopularniejszych modeli uporządkowanych zmiennych 
losowych tj. statystyk porządkowych i wartości rekordowych. 

W rezultacie zastosowania nowego podejścia uzyskaliśmy szereg nowych charakteryzacji 
rozkładów prawdopodobieństwa. Przykłady 2. | [2.21 [3.3}]3.6]oraz|4.1}14.4|podaja nowe wyniki, 
których nie można byłoby otrzymać bez nowego podejścia przedstawionego w niniejszej pracy. 
Zaprezentowaliśmy również nową technikę dowodzenia jednoznaczności charakteryzacji bez 
znajomości jawnej postaci funkcji regresji €. W ten sposób wykazaliśmy, że popularne roz- 
kłady takie jak normalny, Weibulla z parametrem kształtu 6 > 1, Gompertza, gamma, Gumbela 
i logistyczny są jednoznacznie charakteryzowane przez odpowiadające im regresje uogólnio- 
nych statystyk porządkowych, a rozkłady Poissona i ujemny dwumianowy są jednoznacznie 
charakteryzowane przez odpowiadające im regresje słabych wartości rekordowych. 

Z drugiej strony otrzymane rezultaty są trudne w zastosowaniu, co zostało zobrazowane 
w podrozdziałach [2.2] [3.2] i [4.3] Wyniki charakteryzacji są nadal częściowe i wiele problemów 


pozostaje wciąż otwartych. W szczególności są to: 


(1) Zastosowanie nowych kryteriów jednoznaczności charakteryzacji rozkładów prawdopodo- 
bieństwa dla przypadku £ > 2. Czy można uogólnić wyniki otrzymane dla £ = 2 i szcze- 


gólnych postaci funkcji h oraz 5? Między innymi, czy jest możliwe rozszerzenie Twier- 


dzeń [2.3] 3.2|i|4.3]na przypadek £ > 2 (por. Uwaga|2.5); 


(2) Uzupełnienie wyników dla / = 2 oraz gdy h jest funkcja nieograniczoną. Jak pokazuje 
Przyktad[3.7|nie mamy dowodu, ze regresje, które nie są asymptotycznie liniowe względem 


funkcji h jednoznacznie charakteryzują rozkłady prawdopodobieństwa; 
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(3) 


(4 


— 


(5 


— 


(6) 


Dla ustalonych 7, £ > 1, parametrów modelu ,... ,Y,+/ oraz funkcji h określenie warunków 
koniecznych i dostatecznych, na to aby pewna funkcja € była funkcją regresji uogólnionych 


statystyk porządkowych. Podobny problem dla słabych wartości rekordowych; 


Wykazanie jednoznaczności rozwiązania problemu różniczkowego (2.28), gdy h(x) = x 
oraz © (x) = ax+b, a > 0, w przypadku £ > 2. Stanowiłoby to nowy dowód Twierdzenia 5.1 
z pracy (por. Uwaga[2.7); 


Analogiczny problem jak wyżej, dla regresji słabych wartości rekordowych, mianowicie 
wykazanie jednoznaczności rozwiązania problemu różnicowego (4.37), gdy h(j) = j oraz 
6()) =aj+b, a> 0, w przypadku £ > 2. Z jednej strony byłby to nowy dowód znanych 
wyników dla szczególnych przypadków regresji, a z drugiej uzupełnienie problemu jed- 
noznacznej charakteryzacji rozkładów prawdopodobieństwa przez liniową regresję słabych 


wartości rekordowych w przypadku />5ia> 1; 


Uzupełnienie wyników dla regresji dyskretnych wartości rekordowych (por. podroz- 


dział 4.6). 


Kolejnym problemem, który wymaga dalszych analiz jest rozszerzenie wyników prezento- 


wanych w niniejszej rozprawie na przypadek regresji dualnej, to znaczy regresji x względem 


xt 


, czy też regresji W, względem W,+¢. Jednakże w tym przypadku, rachunki są znacznie 


trudniejsze, gdyż odpowiednie funkcje warunkowych rozkładów wyrażają się bardziej skom- 
plikowanymi wzorami (zob. [11], i referencje tam zawarte). 
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